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在 著名 的 博文 “理解 矩阵 "中 ,作者 孟 岩 一 上 来 就 提出 了 令 人 困惑 的 问题 :矩阵 究竟 
是 什么 东西 ? 这 看 似 一 个 简单 的 问题 ,但 其 实 很 难 回答 ,因为 众所周知 , 越 是 简单 的 问题 
越 难 以 说 清楚 . 

最 直观 的 说 法 就 是 “矩阵 是 一 堆 数 ,只 是 在 其 上 规定 了 一 些 运算 ”, 这 有 点 类 似 于 面 
向 对 象 编程 中 的 “类 (class)" 的 概念 . 究 其 原因 , 力 是 先 阵 从 逻辑 上 可 视 为 是 从 “自然 数 一 
实数 ~ 复数 一 超 复数 一 向 量 习 和 盾 阵 "推广 而 来 ,这 也 与 其 历史 发 展 轨 迹 大 致 相当 . 大 家 知 
道 ,人 类 对 于 数 的 研究 已 经 贯穿 了 几 千年 的 文明 史 , 更 媚 论 内 家 更 大 \ 应 用 更 广 的 "向 量 ” 
力 至 “和 矩阵". 自 上 世纪 末 ,G. W. 斯 图 尔 特 就 拟 以 5 册 之 巨著 , 翼 力 于 阐释 “矩阵 算法 ”. 
其 实 依 我 们 加 见 ,关于 和 矩阵 “这 堆 数 ” ,即使 来 个 “ 百 集 连续 剧 ” 也 难以 穷尽 , 因为 " 凡 有 并 
人 台 处 缘 能 歌 柳 词 ”, 和 矩阵 的 “ 芳 踪 "正如 柳 永 的 词 一 般 “ 凡 有 多 元 处 必 有 和 矩阵 ”如今 关于 
矩阵 的 知识 早已 成 为 工程 技术 人 员 必 备 的 数学 基础 知识 ,有 人 甚至 认为 它 就 是 “研究 生 
的 线性 代数 十 高 等 数学 ”. 这 也 说 明 线 性 代数 和 高 等 数学 是 学 习 和 矩阵 分 析 课 程 的 必 备 
基础 . 

基于 自身 的 工科 背景 ,和 孟 岩 指 出 “和 矩阵 是 线性 空间 里 的 变换 的 描述 ” ,并 结合 计算 机 
图 形 学 知识 对 之 进行 了 详细 | 阐释. 事实 上 ,从 更 高 的 层面 看 ,和 矩阵 是 泛 函 中 的 一 种 特殊 的 
线性 算 子 ,可谓 “和 矩阵 即 变换 ”. 了 解 泛 图 分 析 的 读者 都 知道 ,这 已 经 是 用 谤 国 的 眼光 来 看 
待 和 矩阵 了 .一 般 可 将 矩阵 的 理论 知识 大 致 划 分 为 “空间 与 变换 ”"“ 和 盾 阵 分 解 论 ” 以 及 “矩阵 
分 析 论 ” ,其 中 “空间 与 变换 "依托 的 就 是 泛 函 分 析 与 抽象 代数 ,因此 以 变换 的 眼光 看 待 矩 
阵 ,自然 就 具有 高 屋 建 领 之 势 . 这 就 意味 着 我 们 在 教材 编写 和 实际 教学 中 , 既 要 通过 大 量 
实例 丰富 读者 的 感性 认识 ,又 要 极力 渗透 泛 函 分 析 的 初步 知识 ,以 使 读者 逐步 养 成 “一 览 
众 山 小 ”的 视野 . 当然 ,不 同学 科 背 景 的 读者 自然 会 收获 不 同 的 “感性 十 理性 ” 

在 名 著 《 古 今 数学 思想 》 中 ,M. 克 莱 因 写 道 : 

(行列 式 与 矩阵 ) 在 数学 上 并 不 是 大 的 改革 ……* 尽管 行列 式 和 短 阵 用 做 紧凑 的 表达 
式 , 尽 管 矩 阵 在 领悟 群 论 的 一 般 定 理 方面 具有 作为 具体 的 群 的 启发 作用 ,但 它们 都 没有 
深刻 地 影响 数学 的 进程 . 然而 已 经 证 明 这 两 个 概念 是 高 度 有 用 的 工具 ,现在 是 数学 器 具 
的 一 部 分 . 

在 该 书 出 版 的 1972 年 ,他 的 观点 无 可 厚 非 . 但 计算 机 的 飞速 发 展 和 信息 社会 的 如 火 
如 茶 ,使 得 矩阵 世界 在 这 几 十 年 里 发 生 了 翻天 履 地 的 变化 . 
首先 是 矩阵 计算 (又 称 数值 线性 代数 ) 的 异军突起 . 计算 机 的 横 空 出 世 给 线性 代数 研 
究 带 来 了 新 的 机 遇 和 挑战 , 极 大 地 促进 了 和 矩阵 计算 乃至 科学 计算 的 兴起 和 发 展 ,使 得 原 
本 被 许多 人 认为 已 经 “寿终正寝 ”的 线性 代数 “枯木 逢 春 ”. 反 过 来 ,和 矩阵 计算 的 研究 以 及 
Matlab 等 计算 软件 的 不 断 改 进 ,更 是 成 为 大 规模 、 高 速 \ 并 行 移动 .网 络 计算 中 的 得 力 工 


= 和 窍 阵 分 析 与 计算 


具 , 这 进一步 促进 了 诸如 “模型 降 阶 ”等 化 解 “ 维 数 之 咒 ” 的 新 兴 课 题 的 莲 过 发 展 . 世界 顶 
人 尖 的 数值 分 析 学 家 L，N.，Trefethen 早 在 1997 年 就 深刻 地 指出 : 

如 果 除 了 微 积分 与 微分 方程 之 外 ,还 有 什么 领域 是 数学 科学 的 基础 的 话 , 那 就 是 数 
值 线性 代数 ， 

世界 上 最 大 的 专业 学 术 组 织 IEEE( 电 器 与 电子 工程 师 学 会 ) 主 办 的 《科学 与 工程 计 
算 》 和 杂志, 在 2000 年 评选 出 了 ”20 世纪 十 大 算法 ”, 其 中 就 有 3 个 与 年 阵 计 算 直接 相关 , 它 
们 是 1950 年 提出 的 Krylov 子 空间 迭代 法 、1951 年 提出 的 矩阵 计算 的 分 解 方法 以 及 1959 
年 至 1961 年 间 提 出 的 计算 和 矩阵 特征 值 的 QR 算法 . 

此 外 , 吴 文 俊 先 生 的 数学 史 研 究 , 校 正 了 人 们 对 数学 世界 的 看 法 . 受 西方 中 心 论 的 束 
缚 ,之 前 人 们 一 直 认 为 "中 国 证 代数 学 著作 都 是 应 用 问题 集 "， 在 古代 中 国 的 数学 思想 中 ,最 
大 的 缺点 是 缺少 严格 求证 的 思想 ” 吴 文 俊 先生 通过 大 量 分 析 , 明 确 推出 "近代 数学 之 所 以 能 
够 发 展 到 今天 ,主要 是 靠 中 国 ( 式 ) 的 数学 ,而 非 希 腊 ( 式 ) 的 数学 ,决定 数学 历史 发 展 进程 的 
主要 是 靠 中 国 ( 式 ) 的 数学 ,而 非 希腊 ( 式 ) 的 数学 ”, 并 将 中 世纪 数学 发 展 过 程 概括 为 
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中 ,c 表示 世纪 . 他 深刻 地 指出 : 
从 数学 有 史料 为 依据 的 几 千 年 发 展 过 程 来 看 ,以 公理 化 思想 为 主 的 演绎 倾向 以 及 以 
机 械 化 思想 为 主 的 算法 倾向 互 为 消长 . 


我 国 传统 数学 有 其 自身 的 发 展 途 径 与 独到 的 思想 体系 ,而 以 机 械 化 为 其 特色 ;方程 
求解 尤其 是 贯穿 两 千 多 年 发 展 中 的 一 条 主线 . 这 与 遵循 十 希腊 传统 的 西方 数学 的 公理 化 
演绎 体系 大 相 径 庭 , 旨 趣 过 有 异 . 在 历史 长 河中 ,数学 机 械 化 算法 体系 与 数学 公理 化 演绎 体 
系 曾 多 次 反复 互 为 消长 交替 成 为 数学 发 展 中 的 主流 . 

这 就 从 理论 上 回答 了 什么 是 世界 数学 发 展 的 主流 问题 . 当然 , 与 吴 文 俊 先 生 的 研究 
腺 相 辉 映 的 是 ,当时 科学 哲学 领域 也 兴起 了 以 库 恩 为 代表 的 新 历史 主义 学 派 . 

吴 文俊 先生 的 研究 更 使 我 们 明确 意识 到 :对 待 痊 绎 体系 与 算法 体系 ,合理 的 态度 应 
该 是 取 两 者 之 长 , 兼 收 并 曹 ,而 不 能 厚 此 薄 彼 , 褒 一 贬 一 . 比如 矩阵 计算 领域 的 奠基 性 大 
师 骏 斯 堆 尔 德 ,最 先 研 究 的 是 泛 了 六 分 析 , 之 后 转向 生物 数学 ,最 终 建 功 立 业 于 和 矩阵 计算 领 
域 . 事实 上 ,深厚 的 数学 基础 和 丰富 的 计算 机 知识 是 从 事 和 矩阵 计算 的 必要 条 件 . 

男 外 ,布尔 巴 基 学 派 的 “结构 数学 "也 给 入 们 带 来 了 极 大 的 冲击 . 自 20 世纪 30 年 代 
兴起 的 结构 数学 ,在 系统 地 整理 了 数学 知识 的 同时 ,更 给 数学 教育 带 来 了 “新 数学 运动 ”. 
但 由 于 “新 数学 运动 ”一 味 注重 形式 上 的 严格 性 ,忽视 乃至 抹杀 数学 的 直觉 性 ,使 得 学 生 
的 数学 学 习 跌跌撞撞 ,步履 跟 哈 , 满 满 的 都 是 泪水 ,学 生 也 忱 如 杂技 中 表演 钻 火 圈 游 戏 的 
小 白明 ,在 考试 的 皮 莫 挥舞 之 下 拼命 奔跑 ,完全 变 成 了 枯燥 的 规则 的 奴隶 . 

正 是 基于 上 述 认识 ,我 们 认为 ,在 矩阵 分 析 课 程 的 教学 中 ,我 们 更 需要 的 是 “ 返 开 归 
真 改 变 思 维 ”, 是 “抛弃 各 种 有 形 和 无 形 的 思想 枸 锁 ”( 钱 旭 红 语 ). 因此 在 本 教材 的 体系 、 
选材 和 编写 中 ,我 们 力求 突出 以 下 特点 : 
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1， 重 新 整合 内 容 体系 ,兼顾 矩阵 计算 

从 实践 角度 看 ,和 矩阵 分 析 处 理 的 是 线性 化 以 后 的 非 线性 问题 , 它 已 经 深 人 到 了 数值 
求解 的 每 个 领域 ,其 后 续 是 数值 分 析 ( 包 括 抢 阵 计算 、 微 分 方程 数值 解 等 分 支 学 科 ) 的 理 
论 .算法 及 其 语言 实现 . 因此 我 们 认为 ,应 该 将 矩阵 分 析 类 课程 看 成 是 实践 性 很 强 的 理论 
性 课程 . 然而 由 于 方方面面 的 制约 ,目前 已 有 的 教材 都 很 少 涉及 实践 性 方面 ,向 这 正 是 我 
们 希望 通过 本 书 加 以 弥补 并 大 力 宣扬 的 目标 之 一 . 为 此 ,我 们 精心 挑选 了 和 矩阵 计算 中 处 
理 三 大 核心 问题 (线性 方程 组 求解 ,最 小 二 乘 问题 和 特征 值 问题 ) 的 一 些 最 重要 的 数值 
方法 , 尽 可 能 详细 地 | 阐明 它们 的 设计 思想 和 理论 依据 ,并 重新 整合 矩阵 分 析 的 内 容 , 尽 
可 能 使 两 者 无 颖 连接 , 以 避免 给 人 以 突 匹 之 感 . 例如 ,在 回顾 了 线性 方程 组 的 知识 之 
后 ,我 们 通过 高 斯 消 元 法 ,引入 了 LU 分解, 进而 自然 地 导出 了 线性 方程 组 的 数值 求解 
问题 . 
在 本 书 中 ,我 们 还 通过 分 析 Matlab 软件 的 内 置 函数 和 帮助 文档 ,将 其 中 已 公开 的 实 
现 算法 中 所 涉及 的 矩阵 计算 理论 细 市 与 课程 教学 紧密 联系 起 来 ,以 便 读者 理解 计算 结 
果 , 例 如 Jordan 标准 型 与 内 置 限 数 jordan\ 和 矩阵 指数 与 内 置 梁 数 expm、LU 分 解 与 内 置 函 
数 lu、QR 分 解 与 内 置 阴 数 qr、 奇 异 值 分 解 与 内 置 也 数 svd, 等 等 .对 于 本 书 中 所 使 用 的 
Matlab 代码 ,需要 的 读者 请 来 邮 索 取 . 

2. 注重 启发 式 教学 ,力争 将 “冰冷 的 美丽 ”转变 成 “火热 的 思考 ” 

以 定义 开头 , 继 之 以 定理 和 公式 ,再 辅 以 应 用 ,这 似乎 成 了 数学 类 教材 的 典型 模式 . 
这 种 形式 化 的 编 书 方式 ,经 常 让 学 生 觉 得 数学 概念 就 像 孙悟空 一 样 ,是 从 石头 缝 里 踢 出 
来 的 . 对 这 种 “空降 部 队 ” ,学生 从 心理 上 难以 接受 ,也 使 得 “从 间 题 出 发 抽象 出 数学 知识 
再 回 到 问题 "这 种 丰富 多 彩 的 数学 思维 活动 被 " 拘 了 两 头 , 只 剩 中 间 ”, 变 成 了 纯粹 的 逻辑 
推理 , 从 定理 到 定理 ,从 结论 到 结论 . 作为 面向 非 数学 类 工科 学 生 的 教材 ,如 果 也 采取 这 
种 模式 ,对 学 生 而 言 ,无 异 于 梦 持 . 

事实 上 ,作为 启发 式 教学 的 重要 辅助 工具 ,教材 必须 充分 反映 学 生 的 思维 过 程 ,要 通 
过 一 系列 启发 性 的 问题 和 各 种 各 样 的 尝试 和 想法 ,让 学 生 在 观察 .比较 和 推理 中 形成 结 
论 . 我 们 在 本 书 中 充分 注意 学 生 已 有 的 基础 和 经 验 ,注重 采用 多 种 方式 自然 地 引入 数学 
基本 概念 和 基本 方法 . 例如 ,从 齐 次 方程 组 的 求解 引入 向 量 空间 ,从 向 量 空间 和 微 积分 引 
入 线性 空间 ,从 Gram-Schmidt 方法 引入 QR 分解, 利用 几何 直观 引入 SVD, 从 对 和 角 化 间 
题 引 入 正规 变换 及 其 矩阵 ,从 向 量 的 长 度 引 入 向 量 范 数 及 甜 阵 范 数 ,从 高 斯 消 元 法 引入 
LU 分 解 ,等 等 . 

3. 适当 增加 矩阵 的 各 类 应 用 ,淡化 部 分 结论 的 理论 证 明 

为 了 加 强 本 课程 对 修 读 学 生 的 吸引 力 , 以 利于 学 生 快 速 进入 实践 环节 ,同时 为 了 充 
分 展示 矩阵 工具 的 强大 ,教材 中 还 加 入 了 一 些 具 体 应 用 . 当然 ,我 们 也 希望 通过 它们 , 提 
供 解 决 实际 同 题 的 理论 框架 和 思想 方法 .这些 应 用 , 既 包 括 数学 内 部 的 应 用 ,比如 和 矩阵 的 
谱 半 径 .线性 方程 组 的 扰动 分 析 ,线性 方程 组 迭代 法 的 敛 散 性 分 析 、 微 分 方程 数值 解 ,也 
包括 跨 学 科 的 各 种 应 用 ,比如 线性 系统 中 的 状态 空间 理论 .运动 分 析 及 能 控 性 和 能 观 性 、 
模式 识别 中 的 模式 分 类 问题 , 主 成 分 分 析 法 (PCA) 图 像 压 缩 , 等 等 . 

考虑 到 教学 中 的 实际 情况 及 篇 幅 ,编者 适当 略 去 了 部 分 定理 的 证 明 , 并 对 部 分 内 容 
做 了 简化 处 理 . 需要 深入 研究 的 读者 , 可 参阅 书后 所 附 的 参考 文献 . 
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4. 渗入 数学 史 及 数学 文化 ,增强 教材 的 趣味 性 和 可 读 性 

为 了 活跃 课堂 气氛 ,在 课程 讲授 中 ,我 们 经 常 提 及 数学 史 及 数学 文化 ,但 因为 时 间 关 
系 , 师 生 都 觉得 不 过 冶 . 在 撰写 本 书 的 过 程 中 ,与 学 生 多 有 互动 ,他 们 也 希望 能 在 书 中 多 
讲 点 这 些 知识 ,以 增加 课程 的 趣味 性 . 我 们 的 想法 写 进 书 以 后 ,课堂 上 就 不 必 多 费 口舌 
了 . 当然 , 讲 什么 和 讲 多 少 是 个 问题 . 

首先 ,我 们 以 较 大 的 笔墨 (2. 1. 3 和 2. 1. 4 共 两 小 节 ) ,比较 详细 地 阐述 了 向 量 空间 的 
历史 ,以 期 让 读者 初步 领略 公理 化 思想 所 带 来 的 革命 性 变化 ,从 而 在 感叹 “向 量 空间 "这 
个 最 重要 的 观念 来 之 不 易 的 同时 ,能 够 更 深刻 地 领情 到 矩阵 计算 对 公理 化 思想 的 反 拨 ， 
进而 建立 起 更 加 理性 的 数学 态度 . 

其 次 ,基于 我 们 对 矩阵 分 析 与 计算 发 展 历史 的 理解 ,对 于 与 重要 思想 有 关 的 重 楼 人 
物 , 我 们 也 特 辟 专 节 加 以 详细 曾 述 . 比如 提出 Jordan 标准 型 的 艾 米 尔 : 约 当 、 提 出 
Householder 变换 的 豪 斯 霍 尔 德 . 提 出 Hermite 变换 的 埃 尔 米 特 、 发 现 SVD 的 G. HL. 戈 
户 布 . 提 出 雅 可 比 迭 代 和 雅 可 比 和 矩阵 的 雅 可 比 、 提 出 Rayleigh 商 的 瑞 利 勋 本 ,以 及 提出 
Lanczos 过 程 的 兰 乔 斯 ,等 等 . 当然 ,限于 篇 幅 ,我 们 只 能 “故意 遗漏 "一些 重 要 思想 和 人 
物 ,比如 向 后 扰动 分 析 法 的 创始 和 人 和 代数 特征 值 | 问题 上 的 大 师 威 尔 金 森 、 制 定 浮 点 数 标 
准 的 卡 享 ,等 等 . 至 于 与 相对 次 要 的 思想 有 关 的 人 物 ,我 们 也 尽量 给 予 一 定 笔墨 ,比如 发 
现 LU 分 解 的 图 灵 发 现 施 密 特 正 交 化 的 施 密 特 、 提 出 Schur 引 理 的 舒 尔 、 提 出 Galerkin 
方法 的 伽 辽 金 ,提出 Krylov 子 空间 的 克 雷 洛 夫 ,等 等 . 

再 次 ,我们 还 刻意 凸显 了 课程 中 的 “中 国 元 素 ” 例如 高 斯 消 元 法 与 《 九 章 算术 》、 嵌 套 
乘法 与 秦 九 韶 算法 、 范 数 与 枢 培 先生 ,等 等 . 这 在 西方 人 占据 主导 的 矩阵 知识 中 ,是 弥 足 珍 
贵 的 . 
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外 名 
线性 方程 组 


微 积 分 中 对 非 线 性 问题 采用 线性 化 处 理 之 后 ,就 产生 了 大 量 线性 方程 组 求解 问 
题 . 在 线性 代数 中 ,借助 于 “ 秩 ” 这 个 核心 概念 ,线性 方程 组 解 的 三 种 状态 得 到 完美 的 阐 
述 ,因此 线性 代数 作为 研究 课题 一 度 被 认为 已 “寿终正寝 ”. 然而 计算 机 的 横 空 出 世 , 使 
得 线性 代数 “枯木 逢 春 ”, 催 生出 发 展 最 快 .思想 也 空前 活 牙 的 数值 线性 代数 (又 称 和 矩阵 
计算 ). 如 今 ,几乎 所 有 的 数值 计算 软件 都 具有 求解 线性 方程 组 的 功能 . 事实 上 ,它们 大 
都 以 线性 代数 软件 包 LAPACK (Linear Algebra PACKage) 为 基础 ,其 中 涉及 的 基本 代 
数 子 程序 BLAS( Basic Linear Algebra Subprograms) 在 高 性 能 计算 领域 更 是 被 广泛 
应 用 . 


1.1 线性 方程 组 的 解法 回顾 


1.1.1 从 高 斯 消 元 法 谈 起 
让 我 们 先 来 求解 一 个 线性 方程 组 . 
例 1.1.1 人 解 线 性 方程 组 


3zi 十 zz 二 一 1 © (11, 1 


Zi 十 2zz 一 za 一 0 © 
"| 
— Ww We — Zs = 1 @ 


众所周知 ,我 们 可 以 采用 被 高 斯 (C. FE. Gauss,1777 一 1855) 重 新 发 现 的 消 元 策略 来 
求解 这 个 线性 方程 组 ,这 样 就 得 到 了 如 下 的 初等 行 变换 法 (elementary row transforma- 
tion of matrix, 也 称 高 斯 消 元 法 ). 

解法 一 :初等 行 变 换 法 . 

首先 是 消 元 过 程 (elimination process). 

C= 员 
,一 az 十 3m 一 一 1 © 


一 二 m 一 地 全 
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十 2 区 一 2 王 0 @, 


5 )x@ 
“ CD ,一 5 十 3m =—1 © 
3 = 一 上 ©@ 
接 下 来 是 回 代 过 程 (back substitution process). 
二 | 十 2zv = 一 十 OO 1 这 市 27zz 一 一 二 (OV 
(— —)Xx®©@ 
(一 了 XXX 二 十 四 5 
(IT) ed te nk @ zz 一 0 加 
1 
zs 一 一 说 (@) ZX3 gg 四 
Tl = 一 读 中 
en 
zs 一 一 各 的 
上 述 过 程 用 矩阵 形式 可 简洁 地 表示 如 下 : 
1 2 —1: O02 2 一 1 0 
4 一 |3 1 0 -1 ~ |o 一 5 3 一 1 
一 1 一 1 一 2 1) rn(l) lo 1 —3: 1 
“ [入 . 罗 一 1 | OimC—5/iWfl 2 =1!: 0 
rza(1/5) | ; 
0 一 5 3 一 sx 网 二 晤 六 二 路 
0 0 一 12/5; 4/5 0 0 1 ;一 1 
(一 的 人 2 一 到 3] aM 时 一 了 站 全 用 但 9 0 一 1 
~ |0 =5 0; vd ~ |010: 0 ~|I010 0 
ra(l) LO 0 1:—1/3 0 0 1:—1/3 0 0 1:—1/3 


所 以 过 三 (Zi 9 2 ml = ( 1 0， 上 

利用 和 矩阵 的 乘法 及 分 块 矩阵 的 知识 ,可 以 证 明 以 下 定理 

定理 1.1.1 (初等 变换 与 矩阵 乘法 ) 对 mmXn 阶 矩阵 A 施行 一 次 初等 行 变换 (一 次 初等 
列 变换 ) ,相当 于 在 A 的 左边 (右边 ) 乘 以 相应 的 mx 阶 行 初等 矩阵 RCn 阶 列 初等 矩阵 C ) , 即 

A ,ar (1. 1.2) 

由 于 可 逆 和 矩阵 可 以 分 解 成 有 限 个 初等 矩阵 的 乘积 ,因此 定理 1. 1. 1 的 结论 可 推广 到 
可 逆 和 矩阵 . 

定理 1.1.2 (初等 变换 与 可 逆 和 矩阵 ) 对 冯 义 交 阶 矩阵 4 施行 一 系列 初等 行 变换 x ， 
疡 ,7( 初 等 列 变换 ci ,cs,…,c, ) ,相当 于 在 4 的 左边 (右边 ) 乘 以 相应 的 mx 阶 可 道 和 矩阵 
R 二 R… R; RI (nn 阶 可 逆 和 矩阵 C = CI CC ), 即 


rlsrys* Cl ocr 


A BoOB=RA, A BOB=AC (1.1.3) 
其 中 , 行 初等 矩阵 及 对 应 x , 列 初等 矩阵 C 对 应 cj Ci 一 12 二 1.2 ). 
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按 定 理 1. 1. 2, 如 果 么 X 妈 阶 矩 阵 4 经 过 一 系列 初等 变换 化 为 m Xn 阶 和 矩阵 吾 , 则 意 
味 着 存在 x 阶 可 首 和 矩阵 R 及 n 阶 可 道 和 矩阵 C ,使 得 


RAC=B (1.1.4) 


此 时 ,我 们 称 和 矩阵 4 与 B 等 价 (edquivalence) , 记 为 4 一 了 

当 系 数 和 矩阵 4 可 道 时 ,线性 方程 组 Ax 二 b 的 解 为 x 一 4 1b. 若 能 求 出 4! , 即 可 求 
得 线性 方程 组 的 解 . 在 式 (1.1. 3) 中 , 设 RA = 二 了 ,也 就 是 R 一 A ,此 时 , 式 (1.1.3) 显然 
可 理解 成 4 二 A' 被 一 系列 初等 行 变换 ,rs ,… ,7, 变换 成 了 RA 二 了 二 4" , 即 矩阵 4 的 
才 由 1 降 为 0, 因 此, 若 想得到 4 , 显然 只 需 将 同样 的 这 一 系列 初等 行 变换 ,ro ，… ,7 
作用 到 了 二 4” 上 .这样 就 产生 了 例 1.1. 1 的 第 二 种 解法 . 

解法 二 :和 矩阵 求 逆 法 . 


先 求 系数 矩阵 A 的 道 矩 阵 
T 2 一 人 1 
(iD 一 | 3 1 0i:0 1 0~l0 —5 3 41-31 0 
一 1 一 1 一 2:0 0 1 0 1 =—3: 1 01 
1 有 一 0 0 
一 个 一 1 | 1 0 
0 0 —12/5i2/5 1/5 1) lo 0 1 :1 —1/12 —5/12 


A = 0 | 一 5/2 5/4 5/4 0 1 0; 12 一 LI —1/4 
0 0 1 一 1/6 1/12 一 5/12 0 & L176 =1 = 人 1 


1 名 00; S66 —1/12 | : 2 0: 5/6 —1/12 四 


~ 


1 0: 1/2 —1/4 —1/4 
0 0 1!=178 —1A2 — 和 /yl 


1 0 0:=1/6 5/12 四 


所 以 

一 1/6 5/12 1712 
1/2 一 1/4 一 1/4 BB 一 总 一 入 |， 
—]/8 —1/ 咏 一 到 1 一 各 一 了 一 各 
注意 到 线性 方程 组 (D) 等 价 于 4x 一 b, 这 里 5 二 (0, 一 1,1)7, 因此 x 二 AT'b 一 


ey 
3 a 
在 线性 代数 中 ,我 们 还 学 习 了 求解 线性 方程 组 的 伴随 矩阵 法 和 克 莱 姆 法 则 ， 克 莱 姆 
法 则 来 源 自 克 莱 姆 (Gabriel Cramer,1704 一 1752) 于 1750 年 出 版 的 著作 ,可 事实 上 , 它 最 
早 由 麦克 劳 林 (Colin Maclaurin,1698 一 1746, 如今 以 麦克 劳 林 级 数 闻名 于 后 世 ) 创 立 于 


一 工 


龙 -一 


5 1 
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1729 年 ,并 写 人 其 1748 年 出 版 的 遗 作 《代数 学 》 之 中 .数学 史上 充满 了 这 样 的 “ 误 称 定 
律 ”(the law of misonomy), 即 当代 科学 史 专 家 斯 蒂 芬 。 施 蒂 格 勒 (Stephen Stigler) 提 出 
的 一 个 富有 戏 让 性 的 说 法 “Nothing in mathematics is ever named after the person who 
discovered it. ” 

解法 三 :伴随 矩阵 法 . 

由 于 |4| 一 12, 且 An 一 一 2,Aw 一 6,Aws 一 一 2,An 一 5,Aw 王 一 3,Azw 二 一 1,Asi 一 1， 
Ass 二 一 3,Ass 二 一 5. 


- 淘 汪 1 
oh ee 
所 以 4 一 TAT4 =15| 4 3 一 3|, 其 中 A“ 表示 A 的 伴随 矩阵 . 从 而 
三 产生 二 
上 1 AAT 
x=Ab= ( 了 ,0， | 
解法 四 : 克 莱 姆 法 则 . 
由 于 D=|A4| 二 12 关 0, 且 
而 “次 二 j 于 二 村 1 2 0 
| 一 ] ”年 二 交 二 二 和 玫 
4 D D, D;, 全 1 于 T 
国 居 二 一 导 , 前 , 呈 ) = [ 斑 富 区 于) 


思考 :在 如 此 诱 人 的 “四 条 金 花 ”中 , 哪 一 条 才 是 最 娇艳 欲 滴 的 呢 ? 
这 个 问题 读者 可 能 一 时 难以 回答 . 不 过 只 要 查阅 一 下 Matlab 软件 的 内 置 函 数 ,我 们 就 
能 给 出 初步 解答 . 事实 上 ,Matlab 提供 了 内 置 函 数 rref ,可 将 矩阵 化 成 最 简 型 ,同时 ,Matlab 
也 提供 了 内 置 函 数 inv, 可 用 于 求 和 矩阵 的 逆 . 当然 也 可 以 借助 寡 运 算 符 ( 本 质 上 也 是 内 置 函 
数 )““ ”或 左 除 运算 符 ( 本 质 上 也 是 内 置 函 数 )“\” 来 求解 线性 方程 组 ,具体 代码 如 下 ， 
Be [1 2= 15310~= 1= 1= ayb= [= Lj're FH 
% 方 法 一 :初等 行 变 换 法 
[VU,ip]l= rref'(Ab); U(:,ip)= [ ]; x= U; 
% 方 法 二 :和 矩 阵 求 道 法 
x= inv(A)* bp %Sx= A^(- 1)*b 
遗憾 的 是 , Matlab 中 没有 为 伴随 矩阵 法 和 克 莱 姆 法 则 提供 专门 的 内 置 函数 (我 们 当 
然 可 以 自己 编程 实现 ,需要 的 读者 可 来 邮 索 取 配 套 程序 ) ,这 是 否 已 暗示 了 哪 一 打 “ 金 花 ” 
是 最 娇艳 欲 滴 的 了 呢 ? 
1.1.2 计算 复杂 性 分 析 
关于 “ 金 花 ”问题 ,前 面 基于 Matlab 的 分 析 显 然 只 涉及 问题 的 表象 ,我 们 需要 深入 探 
讨 问 题 的 本 质 ,以 给 出 更 有 说 服 力 的 解答 . 特别 要 注意 的 是 ,我 们 要 从 各 个 角度 尽 可 能 地 


将 问题 一 般 化 ,这 意味 着 在 “ 金 花 ? 问 题 中 ,具体 的 系数 矩阵 要 被 一 般 化 为 任意 的 可 道 矩 
阵 4, 矩阵 的 阶 数 要 从 3 阶 一 般 化 为 4 阶 ,因此 线性 方程 组 (DD) 将 被 一 般 化 为 线性 方程 组 
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Ax 一 D, 其 中 A 是 n 阶 可 道 方 阵 . 
判断 一 个 算法 的 优 劣 ,有 很 多 标准 ,其 中 涉及 算法 效率 的 计算 复杂 性 分 析 , 主 要 指 算 
法 执行 时 需要 消耗 的 计算 机 资源 的 “时 ”“ 空 "分析, 包括 运行 时 间 的 开销 (时 间 复 杂 度 ) 
和 存储 的 开销 (空间 复杂 度 ). 显然 ,时 间 复 杂 度 越 小 ,说 明 该 算法 效率 越 高 ,因此 该 算法 
越 有 价值 ;而 空间 复杂 度 越 小 , 则 说 明 算 法 越 好 . 我 们 当然 希望 算法 “又 快 又 省 ”, 但 鱼 与 
能 掌 往 往 不 可 兼 得 . 考虑 到 人 生 苦 得 ,我 们 一 般 采 取 ”* 空 间 换 时 间 ? 的 策略 , 即 主要 考虑 降 
低 时 间 复 杂 度 ,同时 兼顾 甚至 牺牲 空间 复杂 度 
由 于 计算 机 性 能 的 差异 ， 显然 不 能 用 时 间 的 绝对 量 来 * 测度 ”算法 的 时 间 复 杂 度 ,更 
加 合理 的 应 该 是 采用 算法 的 基本 运算 次 数 ,也 就 是 算法 的 所 有 运算 次 数 的 总 和 . 具体 到 
矩阵 算法 问题 ,正如 “ 维 数 灾 难 ” 所 揭示 的 那样 , 抢 阵 的 大 小 显然 影响 和 矩阵 的 运算 量 ， 
观 之 ,时 间 复 杂 度 就 是 矩阵 维 数 的 函数 . 对 于 ? 阶 方 阵 而 言 , 可 记 时 间 复 杂 度 为 TCD. 这 
样 ,我 们 就 可 以 引入 算法 复杂 度 的 阶 数 的 概念 . 
定义 1.1.1 (算法 复杂 度 的 阶 数 ) 如 果 存 在 正常 数 C 和 N, 使 得 当 n 放 N 时 ,对 于 
某 和 矩阵 算法 的 时 间 复 杂 度 T(n), 总 成 立 函 数 fn) ,使 得 了 (x) 之 Cf (2), 则 称 该 算法 的 
时 间 复 杂 度 T(n) 是 f(n) 阶 的 ,并 借鉴 高 等 数学 中 表示 同 阶 无 穷 小 的 大 O 表示 法 , 记 作 
T(n) = O(T(n)). 
对 于 一 些 常 用 的 f(n)，, 成 立 下 列 重要 关系 : 
O(1) < O(logn) < Ot) < Onlogn) < O00) < O00) 一 
O(2") = O03") < On!) < OG) (1.1.5) 


值得 一 提 的 是 , OG ) 与 0(2”) 是 一 个 重要 的 分 水 岭 , 前 者 说 明 时 间 复 杂 度 T(n) 是 
n 的 多 项 式 函 数 , 当 增长 时 , T(n) 的 增长 是 可 以 忍受 的 ,因此 相应 的 算法 被 视 为 “好 ”的 
算法 ;后 者 则 说 明 T(n) 是 的 指数 函数 , 当 增长 时 , TCn) 的 增长 让 人 难以 忍受 ,因此 
相应 的 算法 被 视 为 “ 坏 ” 的 算法 . 如 果 某 问题 存在 多 项 式 算法 , 即 “ 好 ”的 算法 , 则 该 问题 
为 多 项 式 时 间 可 解 问题 ,简称 多 项 式 (polynomial) 问题 . 与 之 相关 的 P/NP 问题 (NP， 
non-deterministic polynomial) 是 计算 复杂 性 理论 (computational complexity theory ) 中 
至 今 尚未 解决 的 问题 . 

下 面 我 们 从 计算 复杂 性 的 视角 来 深入 分 析 “ 金 花 ” 问 题 . 

我 们 知道 , 拉 普 拉 斯 展开 定理 将 一 个 阶 行列 式 的 计算 转化 为 n 个 一 1 阶 行列 式 的 
计算 . 若 按 此 定理 来 计算 行列 式 , 并 用 T(n) 表示 n 阶 行列 式 的 时 间 复 杂 度 ,那么 显然 可 
有 了 Go =zT(n 一 Ds 从 而 Tim) 二 nT n= =Wn= DT 下 = ww 二 1T(1), 因 
此 这 种 算法 的 时 间 复 杂 度 T(n) 是 nl 级 的 , 即 T(r) = O(n1), 这 显然 是 比 指数 增长 
OC(2") 还 要 “ 坏 ” 的 算法 . 所 以 ,尽管 拉 普 拉 斯 展开 定理 在 理论 上 非常 重要 ,但 在 计算 上 一 
般 仅 用 于 低 阶 或 特殊 的 行列 式 . 

克 莱 姆 法 则 要 计算 n 十 1 个 阶 行列 式 , 按 拉 普 拉 斯 展开 定理 折算 ,这 相当 于 计算 一 
个 ?十 1 行列 式 , 即 时 间 复 杂 度 T(n) 是 (x 十 1) 1 级 的 ;伴随 矩阵 法 要 计算 1 个 阶 行列 式 
以 及 x 个 n 一 1 阶 的 代数 余子 式 , 后 者 相当 于 nn 个 n 阶 行列 式 , 因 此 总 体 计 算 量 相当 于 一 
个 nn 十 1 行列 式 ,时间 复 杂 度 T(x) 也 是 (x 十 D1 级 的 ,与 克 莱 姆 法 则 持平 . 人 “ 金 花 ” 
的 计算 复杂 度 都 是 (x 十 1)1 级 的 ,根据 前 面 的 分 析 , 当 维 数 达 到 一 定 规模 后 ,这 显然 是 
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“不 可 能 完成 的 任务 ”, 我 们 只 能 忍痛 割爱 . 

至 于 和 矩阵 求 道 法 ,显然 比 初等 行 变 换 法 费时 ,这 是 因为 前 者 求 道 时 要 人 处理 的 长 方形 
矩阵 是 n X 2n 阶 的 ,而 且 求 出 47 后 ,还 需要 进行 矩阵 4 ” 与 向 量 b 的 矩阵 向 量 乘法 
A 0D, 而 后 者 只 需要 处 理 nX (n 十 1) 阶 的 长 方形 矩阵 ,并 且 不 必 处 理 矩 阵 向 量 乘法 A 1'b. 

至 此 ,我 们 不 难 发 现 , 基 于 高 斯 消 元 策略 的 初等 变换 法 最 娇艳 欲 滴 的 那 条 “ 金 花 ”. 
一 句 话 :变换 是 王道 ! 

思考 :(1) 初等 行 变换 法 的 时 间 复 杂 度 是 多 少 ? 

(2) Matlab 提供 了 内 置 函 数 det, 用 于 计算 方 阵 的 行列 式 . 问题 是 ,既然 拉 普 拉 斯 定 
理 不 能 用 于 高 阶 行列 式 的 数值 计算 ,那么 高 阶 行列 式 的 数值 算法 又 是 基于 什么 原理 呢 ? 
1.1.3 历史 开 了 个 大 玩笑 

1801 年 ,年 仅 24 岁 的 高 斯 出 版 了 划时代 的 巨著 《算术 研究 》 在 书 中 ,他 围绕 三 个 核 
心 课 题 , 即 同 余 理 论 .二 次 型 理论 和 二 次 互 反 律 ,系统 地 整理 了 前 人 在 数论 中 的 各 种 零星 
成 果 . 在 书 中 的 二 次 型 理论 中 ,高 斯 系统 地 推广 了 欧 拉 (Leonhard Euler,1707 一 1783) 、 拉 


格 朗 日 (Joseph-Louis Lagrange,1736 一 1813) 等 人 的 二 次 型 理论 ,将 整数 nn 表示 成 整数 
a .bc.x\y 的 二 次 型 , 即 
F(xsy) = ar’ bryitey :=n 
然后 通过 变换 
守土 oz 十 By OD 
| (1. 1.6) 
3 二 和 间 吕 名 


将 FCz,y) 变换 成 新 的 二 次 型 已 (zy ) = 二 ar“ 十 bry 十 cy 其 中 的 一 ac == (6 
一 ac) (只 一 房 关 . 高 斯 进而 指出 ,如 果 (6 一 BY)? 一 1, 则 可 将 F(x’,y ) 变换 成 F(x， 
y)， 从 而 导出 了 他 的 “型 等 价 ” 的 概念 . 而 他 得 到 相应 变换 的 方法 ,就 体现 了 消 元 法 的 思 
想 , 即 把 式 (1. 1. 6) 看 成 关于 x ,y 的 线性 方程 组 ,然后 由 X65 一 四 Xp, 得 &r 一 By = 
(只 一 BY)T ,由 加 Xa 一 四 Xy, 得 一 并 十 ay = 二 (WB 一 BY)y, 当 D= WB 一 By 关 0 时 , 即 
得 所 需 的 变换 


x — Br+ie OO 
(Cl, 7 
y -了 + 各 @ 
其 中 的 系数 都 是 整数 ,因为 D: 一 1. 
高 斯 的 消 元 法 思想 隐藏 在 二 次 型 理论 中 , 隐 
涩 难 明 . 可 是 实际 上 ,* 消 元 法 是 中 国 的 ,因为 中 
国 早 在 秦汉 时 期 就 已 明确 给 出 了 线性 方程 组 的 这 
种 解法 . 图 1 - 1 是 现 藏 于 上 海 博物 馆 的 东汉 光 和 pe 
大 司 农 铜 解 ,其 器 口 、 底 沿 刻 有 相同 的 89 字 铭 文 ， 一 
“大 司 农 以 成 实 诏书 ,秋分 之 日 , 同 度量 ,均衡 石 、 图 1- 1 光 和 大 司 农 钢 负 
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搓 斗 桶 . 正 权 概 , 特 更 为 诸 州 作 铜 斗 刨 、 称 尺 , 依 黄 
钟 律 历 . 九 章 算术 ,以 均 长 短 \ 轻 重 .大 小 ,用 其 七 
政 , 令 海内 都 同 , 光 和 二 年 头 月 廿 三 日 ,大 司 农 草 
禄 、 丞 淳于 宣 、. 右 仓 曹操 朱 音 、 史 韩 鸿 造 . 铭文 中 
作为 制 器 依据 被 提 及 的 《 九 章 算术 》( 见 图 1 - 2) 
一 书 ,肯定 更 早 于 光 和 二 年 (公元 179 年 ). 数学 
史 界 一 般 认定 该 书 的 主要 内 容 “ 在 先秦 已 具备 ， 
因 秦 及 秦 末 战乱 散 坏 ,经 西汉 张 苍 、 耿 寿 昌 先后 
删 补 而 成 ” 后 世 的 中 国 古 代数 学 家 , 大 都 是 从 
《 九 章 算术 》 开 始 学 习 和 研究 数学 ,曹魏 时 期 的 刘 
徽 等 人 还 曾 为 它 作 过 注释 . 

《 九 章 算术 》 以 实际 应 用 为 目的 ,前 六 章 ( 即 

方 田 ,粟米 、 训 分 . 少 广 . 商 功 和 均 输 ) 中 的 问题 池 
盖 了 人 们 日 常生 活 、 生 产 中 的 各 种 实际 问题 , 书 图 1- 2 《 九 章 算术 ) 
中 非常 重视 计算 ,包括 了 大 量 计算 公式 或 计算 程序 ( 即 算法 ) ,充分 体现 了 中 国 十 代 
数学 的 “构造 性 与 机 械 化 ”( 吴 文俊 语 ) 特 色 . 特别 是 在 第 八 章 方程 中 ,不 仅 通过 算 筹 
的 筹 式 表示 了 线性 方程 组 的 增 广 和 矩阵 ,而 且 还 通过 筹 算 , 实 际 上 给 出 了 求解 线性 方 
程 组 的 初等 变换 法 . 我们 不 妨 通过 一 个 典型 事例 ,来 看 一 下 古人 的 解法 . 

例 1.1. 2 《 九 章 算术 ) 第 八 章 方程 第 一 题 :“ 今 有 上 禾 ( 指 上 等 稻 子 ) 三 秉 ( 捆 ) ,中 
禾 二 秉 ,下 禾 一 秉 , 实 (谷子 ) 三 十 九 斗 ;上 禾 二 秉 ,中 禾 三 秉 ,下 禾 一 秉 , 实 三 十 四 斗 ; 上 
禾 一 秉 ,中 禾 二 秉 ,下 禾 三 秉 , 实 二 十 六 斗 . 问 上 ,中 、 下 禾 实 一 秉 各 几何 ?” 若 按 现代 的 
记 法 , 设 二 、z、z 依次 为 上 中、 下 禾 各 一 乘 的 谷子 数 , 则 上 述 问题 就 是 求解 三 元 一 次 
方程 组 : 
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25 十 Srv 二 二 34 
be 动 | 十 2X 十 3x 一 26 
该 书 中 是 这 样 描述 求解 方法 的 “ 置 上 禾 三 秉 ,中 禾 二 秉 , 下 禾 一 秉 , 实 三 十 九 斗 ,于 
右 方 中、 左 行列 如 右 方 . “此 即 如 下 左 侧 所 示 图 表 ( 注 意 古代 的 阅读 习惯 是 从 右 至 左 ). 
右 侧 为 矩阵 记号 . 


1 包 $3 

急用 1 肚 
名 仿 2 

23 1 34 
a 1 1 

1 区 多 
26 34 39 


然后 ， 以 右 行 上 禾 遍 乘 中 行 ,而 后 直 除 . ”这 就 是 说 ,将 中 间 这 一 列 乘 以 系数 3 ( 右 列 
中 的 上 砂 数 ), 再 减 去 右 列 的 一 个 倍数 (本 例 中 为 系数 2 ),， 用 矩阵 记号 , 即 为 先 执行 


加 矩阵 分 析 与 计算 


rsk3), 再 执行 riz(— 2). 


由- 蓝 ， 交 
3 9 
入 人 风 : 
0 5§ 1+24 
3 1 4 , 
1 2 3:;26 
26 24 39 


“又 乘 其 次 , 亦 以 直 除 . ”对 左 列 进行 类 似 的 操作 .用 和 矩 阵 记 号 , 即 为 先 执行 六 (3), 再 
执行 riz(— 1). 


人 看 条 

3 2 1:39 
4 5 2 : 

0 于 Ld 
5 1 了 : 

0 4 .8:39 
39 24 39 


“ 然 以 中 行 中 禾 不 尽 者 遍 乘 左 行 ,而 以 直 除 ”, 即 用 中 间 这 一 列 的 系数 5 乘 以 左 列 ,再 
减 去 中 列 的 4 倍 ,并 进行 约 分 . 用 抑 阵 记号 , 即 为 先 执行 六 (5), 再 执行 ro3( 一 4), 然后 用 
变换 xr;(1/9) 约 分 了 系数 36 和 常数 99. 


0 0 3 

3 双双 
0 a 2 : 

0 5 1:24 
外 下 1 : 

0 0 区 三 
ll 24 39 


“ 左 方 下 条 不 尽 者 ,上 为 法 ,下 为 实 . 实 即 下 禾 之 实 . ”这 就 是 说 , 左 列 中 的 系数 4 称 为 
法 ,常数 11 就 是 4 秉 下 禾 之 实 . 

前 面 是 “ 消 元 ”的 过 程 , 接 下 来 就 是 “ 回 代 ” 的 过 程 . 

“ 求 中 禾 , 以 法 乘 中 行 下 实 , 而 除 下 禾 之 实 . 余 如 中 禾 秉 数 而 一 , 即 中 禾 之 实 . ” 即 用 系 
数 4 乘 以 中 列 ,再 减 去 左 列 的 1 倍 ,并 进行 约 分 . 用 矩阵 记号 , 即 为 先 执行 r,(4), 再 执行 
raz(—1) 和 rs(1/5). 


0 0 3 

3 2 1:39 
0 如 多 

5 二 1 
4 0 1 

0 0 4:11 
11 17 39 


“ 求 上 禾 亦 以 法 乘 丰 行 下 实 ,而 除 下 禾 、 中 禾 之 实 . 余 如 上 禾 秉 数 而 一 , 即 上 禾 之 实 .” 
即 仍然 用 系数 4 乘 以 右 列 ,再 分 别 减 去 左 列 的 1 倍 和 中 列 的 2 倍 , 并 进行 约 分 , 用 矩阵 记 
号 , 即 为 先 执行 六 (4)， 再 执行 m (一 1) 和 ,最 后 用 xs(1/3) 进行 约 分 . 
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0 0 4 

4 0 0:37 
0 4 0 | 

0 4 0:17 
4 0 0 

0 0 4:;11 
ll dy 3% 


“ 实 皆 如 法 ,各 得 一 斗 " 即 三 个 常数 都 除 以 法 4 就 得 到 了 一 秉 上 禾 实 .中 禾 实 和 下 禾 
实 的 半数 分 别 为 9 二 斗 .4 二 斗 和 2 半 斗 . 

由 于 当时 用 抽象 的 语言 难以 表达 明白 ,因此 书 中 借助 于 禾 实 来 阐述 ,正如 刘 微 所 言 
“此 都 属 也 . 以 空 言 难 晓 , 故 特 系 之 用 以 决 之 . "然而 中 国人 毕 葛 没有 发 展 出 矩阵 理论 .这 
一 点 ,即使 国外 最 严 并 的 数学 史家 卡 艾 (Victor J Katz) 也 承认 ,“ 事 实 上 ,中 国人 的 解法 
实质 上 与 高 斯 消 元 法 一 致 ,而 且 是 用 和 矩阵 的 形式 表示 出 来 的 “他 遗憾 地 将 这 种 情况 的 出 
现 归 之 于 中 国人 习惯 于 用 文字 表达 所 有 问题 及 其 解 , 却 从 未 采用 过 “能 使 类 似 问题 解 起 
来 毫 不 费力 的 符号 系统 ”对 此 ,我 们 只 能 在 懂 慢 与 缅怀 之 余 , 空 自 路 叹 . 


0 


类 似 于 数 (代数 式 ) 的 因子 ( 式 ) 分 解 ,矩阵 的 各 种 分 解 在 矩阵 计算 中 也 扮演 着 相当 重 
要 的 角色 .矩阵 的 LU 分 解 本 质 上 是 高 斯 消 元 法 ,因此 其 起 源 可 追溯 到 《 九 章 算术 》 或 高 
斯 . 事实 上 ,高 斯 使 用 的 是 对 称 正 定 和 矩阵 的 分 解 和 一 LDL'. 但 用 和 矩阵 来 表示 它们 ,并 在 
其 中 注入 数值 计算 的 思想 , 则 是 晚近 才 发 生 的 事 ,尤其 是 计算 机 问世 之 后 . 


1.2.1 LU 分 解 定理 


在 用 初等 行 变换 法 求解 线性 方程 组 (1. 1. 1) 的 过 程 中 ,我 们 考察 系数 矩阵 的 变换 
情况 : 


上 芝 一 骨 riz (一 3) 1 2 一 并 rs 1/5) | 2 二 
A=|3 1 0 一 - 总 “一 区 3 2 | 着 一 二 3 三 也 
一 一 外 一 有 tl) Wo 1 二 = 咏 0 0 —12/5 


显然 U 是 上 三 角 和 矩阵 ,其 对 角 元 1、 一 5 和 一 12/5 称 为 消去 过 程 中 的 主 元 (pivot)， 
三 个 变换 ris(— 3)、ria(1) 和 123 (1/5) 中 使 用 的 倍数 被 称 为 乘 子 (multiplier). 
由 定理 1. 1. 1 可 知 


及 (175) Ris(1) Rs(—3)A=U (1 ,1 
因此 
A= LR (1/5) Ri;(1) Ri,(— 3) TU 一 LR1; t— 8 1 [Ri (1) 1 LR»sC(1/5) TU 


三 一 Ri,(3) Ri;(— 1 R;2; (一 1/5)U 
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] 0 Qiyri 2 = 
二 | 3 ] Ql I 一 息 3 二 LU 
一 -1 =1/5 WW © =lgs 


形 如 工 这 样 的 对 角 元 都 为 1 的 下 三 角 矩 阵 被 称 为 单位 下 三 角 和 矩阵 (unit lower trian- 
gular matrix). 类 似 地 ,我们 称 对 角 元 都 为 1 的 上 三 角 和 矩阵 为 单位 上 三 角 和 矩阵 Cunit upper 
triangular matrix). 

思考 :观察 矩阵 L 下 三 角 部 分 的 3 个 元 素 , 它 们 与 所 使 用 的 3 个 行 初等 变换 有 什么 关系 ? 

定义 1.2.1 如 果 方 阵 A 可 以 分 解 成 单位 下 三 角 和 矩阵 L 与 上 三 角 和 矩阵 上 的 乘积 , 即 

A=LU El; 2 2 
则 称 式 (1. 2. 2) 为 4 的 LU 分 解 (LU decomposition, 如 图 1-3 所 示 ) 或 三 角 分 解 (trian- 


gular matrix decomposition). 


图 1-3 和 矩阵 分 解 4 王 EU 


据 此 ,对 线性 方程 组 hx 二 b, 若 系数 矩阵 4 存在 LU 分 解 , 则 有 4x = LUx = L(Ux) 一 
b, 这 说 明 我 们 可 通过 求解 两 个 特殊 的 三 角 方程 组 Ly 二 b,Ux 二 y 来 求解 线性 方程 组 
Ax 一, 这 就 是 Matlab 等 数值 软件 中 采用 的 方法 . 

例 1.2.1 用 LU 分 解 重 解 线性 方程 组 (1. 1. 1). 

解 :由 上 述 分 析 可 知 问题 已 转化 为 求解 两 个 三 角 方 程 组 Ly 一 就 和 Ux = y, 即 


1 0 01 fy 0 1 2 | Zl yi 
3 1 ol 六 1 二 | 一 1 0 —§5 号 一 
-] = lly 1 0 0 — 12/5, lx Ys 


对 第 一 个 方程 Ly 二 b, 采用 向 前 消去 法 ,可 依次 确定 未 知 数 wm ,y ,y%， 即 


N=0, %=—1—3y=—1, y%=1++1+ Ds 4 
oD 9 


接着 采用 向 后 消去 法 解 第 二 个 方程 Ux 二 y, 则 可 依次 确定 未 知 数 zx ,zz ,zx ， 即 


， 此 图 由 华东 理工 大 学 信息 学 院 2012 级 研究 生 赵 明 同 学 创作 . 
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显然 例 1. 2. 1 中 求解 三 角 方程 组 的 解法 可 推广 到 一 般 形式 . 
对 于 三 角 方程 组 Ly = b, 令 L = (ls ) xn sy 二 《31 y2 2 = (bi ,0 sb), 
则 通过 解 第 i 个 方程 求 出 y; 即 可 得 此 解法 的 一 般 形式 
二 一 和 一 一 一 (| 


如 果 7 从 1 到 向 前 依次 计算 yi,ys，…,y,， 则 y 的 所 有 分 量 都 可 求 出 . 
对 于 三 角 方程 组 Ux 二 yy, 令 U 二 (6)waox 一 (zz)TI， 则 通过 解 第 ;个 方 
程 求 出 x; 即 可 得 此 解法 的 一 般 形式 


Xi 一 Cy: UX Ui TH2 Za ) /Ui (1. 2. 4) 


如 果 i 从 n 到 1 问 后 依次 计算 Tn Trl 1， 则 x 的 所 有 分 量 都 可 求 出 . 
显然 ,在 计算 y; 的 式 (1. 2. 3) 中 ,需要 i 一 1 次 乘法 和 i 一 1 次 减法 ,因此 该 解法 的 总 计算 


量 为 > (一 1 十 i 一 1) 二 n(n 一 1) 次 ,即时 间 复杂 度 为 O02); 在 计算 x 的 式 (1.2.4) 中 ， 
i=1 


需要 n 一 i 次 乘法 , n 一 i 次 减法 和 一 次 除法 ,因此 该 解法 的 总 计算 量 为 > (x 一 i 十 n 一 i 二 1) 
i=1] 
一 j2 次 ,即时 间 复 杂 度 也 为 OG2). 
我 们 给 出 Matlab 的 相关 代码 段 如 下 ,其 中 我 们 用 y; 覆盖 了 6;, 因为 5; 仅 在 计算 y， 
的 公式 中 用 到 : 
for i= 2:n % 前 向 消去 
b(i)= b(i)= L(i,l1:i= 1)* pb(1:i- 1)， 
end 
b(n)= p(n)/U(n,n) ; 
for i= n- 1:- 1:1 % 后 向 消去 
B= (~ Ti Lm Bl Tn)y/O GD) » 
end 
什么 样 的 矩阵 才 有 LU 分 解 呢 ? 因为 LU 分 解 可 用 于 求解 线性 方程 组 Ax = b, 我 们 
自然 先 考 虑 可 逆 方 阵 4. 
设 有 4 三 LO, 根据 行列 式 的 柯 西 (Augustin Louis Cauchy,1789 一 1857) 定 理 ， 
即 乘积 的 行列 式 等 于 行列 式 的 乘积 ,并 注意 到 |L|==1, 则 0 关 |4|= |L|. |U|= 
IU|, 这 说 明和 矩阵 已 也 是 可 道 矩阵 , 即 其 对 角 元 都 不 为 零 . 将 A,L,U 适当 分 块 如 下 ， 


A A Ly OU Uy LuU x 

As A 呈 Ls LO Us 加 xX X 
其 中 ,“X” 表 示 我 们 不 关心 相应 的 元 素 值 ,因此 A1 二 Ln Uu, 从 而 

[414|=|LuD0n |=|L| [Di|=1. [Un|=|U| 


由 于 |Un| 关 0, 因此 |Au | 关 0. 分 块 矩阵 Au 是 矩阵 4 的 顺序 主子 矩阵 ,考虑 到 A， 
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在 阶 数 上 的 任意 性 ,因此 矩阵 4 的 任意 阶 顺 序 主 子 式 都 不 为 零 . 显然 ,这 个 结论 要 比 " 拢 
阵 叉 可 逆 ? 强 得 多 . 这 个 结论 是 否 也 是 充分 的 呢 ? 

定理 1.2.1 ( LU 分 解 定理 ) 如 果 ? 阶 方 阵 4 的 各 阶 顺 序 主子 式 A 关 0(k 二 1， 
2,…,n)，, 即 A 的 各 阶 顺 序 主子 矩阵 A 都 可 道 , 则 存在 唯一 的 单位 下 三 角 和 矩阵 工 与 唯一 
的 非 奇异 上 三 角 和 矩阵 U, 使 得 4 = LU. 

证 明 : 我 们 对 使 用 数学 归纳 法 来 证 明 每 个 A 都 有 LU 分 解 . 

当 上 有 二 1 时 ,由 于 Ai 二 (an) 可 道 ,因此 == (1), UU == (an). 

设 A 具有 LU 分 解 Ai 二 LU. 由 于 4 可逆, 故 14 | = | 大 Ui|= |L | IUi| 关 0， 
从 而 Li 和 都 是 可 首 的 ,并 且 A “二 UL". 这 样 Airi 就 有 下 列 分 解 : 


(A [24 L U: L. C 


< 


三 Las Ue (1; 2. 5) 
ApH ,EH —P A 'a 
其 中 , xc 和 B 分别 是 A 的 第 十 1 列 和 第 十 1 行 的 前 & 个 元 素 构 成 的 & 维 列 向 量 . 
根据 归纳 假设 , L 是 单位 下 三 角 和 矩阵 , Us 是 上 三 角 和 矩阵 ,因此 Li 是 单位 下 三 角 和 矩 
阵 , Ui 是 上 三 角 和 矩阵 ,这 样式 (1. 2. 5) 就 是 4xo 的 LU 分 解 .另外 ,注意 到 | Le | 二 1 及 
A 可 逆 , 故 


PB'U: 1 1 


Pp CAHLAHl 


[De | = | Len | [Usri | | EU | = [Ai | 关 0 


因此 Ui 也 是 可 道 的 , 且 其 对 角 元 cea,ea 一 PB A '@ 关 0. 

由 数学 归纳 法 , 4 的 顺序 主子 矩阵 A 都 具有 LU 分 解 ,因此 最 大 的 顺序 主子 矩阵 
A, 二 4 也 具有 LU 分 解 . 

下 面 用 反 证 法 证 明 LU 分 解 的 唯一 性 . 设 4 二 LU 和 4 二 LU 都 是 4 的 LU 分 解 , 则 
由 A 可 道 ,可 知 L,U 和 无 ,UV 都 是 可 道 的 ,因此 (LY)7L 二 UUT', 由 于 单位 下 三 角 抢 阵 
的 乘积 和 首 和 矩阵 仍然 都 是 单位 下 三 角 和 矩阵 ,上 三 角 和 矩阵 的 乘积 和 首 和 矩阵 仍然 都 是 上 三 角 
和 矩阵 ,所 以 (L')71L 是 单位 下 三 角 和 矩阵 , UV' U7 是 上 三 角 和 矩阵 ,由 于 (L 7iL 一 UUT', 因 
此 只 能 有 (LD)7L==UV U7 = 了 此 即 L = 二 LL,U ==U. 证 毕 . 

如 何 计算 矩阵 的 LU 分 解 呢 ? 显然 ,如 果 和 矩阵 4 具有 LU 分 解 4 = LU, 那么 矩阵 LL 
可 逆 , 即 存在 可 逆 和 矩阵 五, 使 得 LL 二 了 从 而 Li& 二 LiLU ==U, 这 也 就 意味 着 


Li tA,T) = (LiA,L:) 2 (U,L') C1, 多 6) 


根据 定理 1. 1. 2, 这 说 明 可 通过 对 (4, 了 D 做 一 系列 行 初等 变换 来 求 出 U 和 LL , 进而 
就 可 求 出 单位 下 三 角 阵 工 的 逆 矩 阵 工 . 

定理 1.2.2 (LDU 分 解 定理 ) 如 果 n 阶 方 阵 A 的 顺序 主子 式 A, 关 0 (k= 二 1,2,…， 
7), 则 存在 唯一 的 单位 下 三 角 和 矩阵 工 ,、 唯一 的 单位 上 三 角 和 矩阵 U 以 及 对 角 和 矩阵 也 , 使 得 
A =LDU. 

画图 可 知 ,矩阵 的 LDU 分 解 具有 中 心 对 称 性 ,并 能 让 我 们 领略 到 一 种 对 称 美 . 
(1 2 一 1 

a 1 6 

[一 1 一 1 一 2 


例 1.2.2 求 和 矩阵 4 王 的 LU 分 解 . 
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解 :由 于 Ai, 二 1,As = 一 5,As 二 12, 即 各 阶 顺序 主子 式 都 不 为 零 , 根 据 LU 分 解 定 理 
可 知 , 矩 阵 4 具有 唯一 的 LU 分 解 . 


(ET 


1 0 0 
从 而 工 王 万 二 | 3 1 “0|, 故 所 求 分 解 为 


-1 一 J 让 1 
1 -hl! 1 0 01fL 2 = 
4 一 | 3 1 0 | 二 | 3 1 Ml | = 3 = LU 
= 一 小， 一 一 多 一 下 一 一 


读者 在 前 面 应 该 已 经 注意 到 以 下 事实 , 即 和 矩阵 工 的 下 三 角 部 分 的 三 个 元 素 3、 一 1 和 
一 1/5, 实际 上 就 是 将 4 变换 成 UU 的 过 程 中 所 使 用 的 三 个 乘 子 的 相反 数 , 并 且 元 素 的 位 置 
也 与 相应 的 行 初等 变换 相对 应 . 这 个 事实 在 理论 上 也 可 以 说 明 清 楚 , 为 此 我 们 引入 基本 
和 矩阵 刀 ; (fundamental matrix, 即 第 i 行 第 ;7 列 元 素 为 1、 其余 元 素 都 为 0 的 mXn 和 矩阵 ,不 
要 与 初等 矩阵 混淆 ). 注意 到 

五 ;五 w = OnE (li mr Sl ES (1 7) 
其 中 , 6x 是 克 罗 内 克 (Leopold Kronecker,1823 一 1891) 记 号 : 当 j = 一 上 时 6% 一 1, 当 j 关 
kk 时 6x 二 0. 显然 行 初等 矩阵 
Ri;(s) = TITsE;, Ralt)=IttiE;: (li,j,k<n) 
因此 , 当 1 k 时 ,有 EE rt O， 从 而 


Ry (Ss)Ra (1) = (Ti+ sEi) (TiEs) = TisE;t ithe stEiEs = TsE;+t th 
回 到 前 面 的 例子 ,由 式 (1. 2. 1) 易 知 

L = [Rs(1/5)Ri CR (一 3) = Ri (3)R1(— 1)Rz(— 1/5) 
由 于 Rw (3)Ris (一 1) 二 了 十 3B2z 一 Ea, 因此 


L= (+3E2 — Ea)Rs(— 1/5) = (T+ 3E, En) (I —BEw) 


= I 3E;, E;l FE 5 En Es | EuE 二 了 4 3E, 五 31 5 Es 


这 就 解释 了 上 述 事 实 . 不 过 要 提醒 读者 的 是 ,用 乘 子 来 确定 矩阵 工 , 虽然 对 一 般 情形 
也 成 立 , 但 其 理论 分 析 却 比较 繁琐 ,有 兴趣 的 读者 请 查阅 文献 [69]. 
LU 分 解 的 发 现 ,要 归功 于 计算 机 科学 之 父 人 工 智 能 之 父 阿 兰 . 图 灵 (Alan Tur- 
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ing,1812 一 1954, 见 图 1- 4). 2012 年 是 他 100 周年 诞辰 ,被 定 
为 “阿兰 。 图 灵 年 ”众所周知 ,他 是 计算 机 逻辑 的 芮 基 者 ,提出 
了 “图 灵机 ”和 “图 灵 测 试 ” 等 重要 概念 . 人 们 为 纪念 其 在 计算 机 
领域 的 卓越 贡献 而 专门 设立 了 “图 灵 奖 ”. 目前 获 此 殊荣 的 华人 
仅 有 一 人 , 即 2000 年 的 获奖 者 姚 期 智 (Andrew Chi-Chih Yao). 
1945 年 ,图 灵 提 交 了 报告 书 4 关 于 自动 电子 计算 机 (ACE) 的 数 
学 设计 说 明 书 》(1972 年 才 被 解密 ), 最 先 用 文字 表述 了 存储 程 
序 控制 的 概念 ,并 据 此 设计 出 计算 机 . 在 随后 的 几 年 里 ,他 致力 .| 
于 计算 机 程序 理论 的 研究 ,并 于 1948 年 发 表 了 “和 矩阵 方法 的 售 
人 误差 (Rounding-off errors in matrix processes) ”一 文 , 正 式 提 
出 了 LU 分 解 . 这 件 史实 也 再 次 印证 了 计算 机 理论 研究 与 矩阵 计算 的 紧密 关系 . 


1.2.2 列 选 主 元 法 


1-4 图 灵 (1912 一 1954) 


3 1 0 
1 另 ”= 
“= 
分 析 : 观 察 可 知 ,只 要 对 和 矩阵 做 一 次 第 一 类 行 初 等 变换 ris, 即 可 将 4 变换 成 例 1. 2. 2 
中 的 矩阵 A (这 里 记 为 4 ), 即 RisA 一 Ai = LU. 
事实 上 ,Matlab 提供 了 内 置 函 数 ju, 用 于 计算 矩阵 4 的 LU 分 解 ,其 语法 格式 为 


例 1.2.3 求 和 矩阵 4 王 的 LU 分 解 . 


[L,U] = lu (A) 
用 lu 来 计算 例 1. 2.2, 得 到 的 工 和 UU 如下: 
Ds 
EB 注 0 
1 0 0 
= 1/3 = 2/5 卫 
Y= 
3 1 0 
0 5/3 二 1 
0 0 = 了 5 
显然 上 面 的 二 不 是 单位 下 三 角 和 矩阵 . 而 用 lu 来 计算 例 1. 2. 3, 却 能 得 到 4 的 LU 分 
解 如 下 : 
I= 
1 0 0 
1/3 1 0 
= 1/3 =/ 1 
U= 
3 1 0 
0 SYS3 -1 
0 0 = 12/5 


这 不 禁 让 人 想起 (大 话 西 游 ) 中 的 “ 移 魂 大 法 ”, 我 们 本 想 借 力 于 神功 , 却 不 料 弄 巧 成 


第 1 章 线性 方程 组 I 


拙 ,这 让 我 们 情 何 以 堪 ? 不 过 考虑 到 第 一 类 行 初等 变换 ri; 具有 对 等 性 ,而 例 1. 2. 3 中 的 
A 却 具有 标准 的 LU 分 解 ,这 启发 我 们 正确 的 途径 似乎 应 该 是 通过 ma， 将 例 1. 2. 2 中 的 
抢 阵 入 反 过 来 变 成 例 1. 2. 3 中 的 A. 更 一 般 地 ,我 们 需要 对 这 种 思路 进行 深入 人 研究. 为 
此 ,我 们 先 引 入 “置换 矩阵 ?的 概念 . 

定义 1.2.2 每 一 行 和 每 一 列 上 正好 有 一 个 元 素 为 1, 而 其 余 元 素 都 为 0 的 方 阵 , 称 
为 置换 矩阵 或 排列 矩阵 (permutation matrix)， 

例如 ,和 矩阵 P= (el,e;,e,e;) 就 是 按 序号 (1342) 重 排 四 阶 单位 矩阵 于 一 〈elyezyes， 
ei) 的 相关 列 后 得 到 的 排列 矩阵 ,此 时 对 四 阶 方 阵 4 三 (oil ,oz ,03,04)，, 验算 可 知 B= AP 
一 (al ,as :04,02)， 即 按 序号 (1342) 重 排 矩阵 4 的 列 即 得 矩阵 B. 

由 于 上 述 卫 也 可 通过 按 序 号 (1423) 重 排 单位 矩阵 I 的 相关 行 来 得 到 ,我 们 自然 猜想 
对 和 矩阵 A, 左 乘 PP 的 效果 就 是 按 序号 (1423) 重 排 4 的 行 . 验算 可 知 此 言 不 雇 . 

特别 地 ,对 向 量 x 二 (zi ,xz ,x3,X4) GE 民 ' ,计算 可 知 Px 二 (zi,z4,Xz,X3)', 即 向 
量 x 的 元 素 也 按 序号 (1423) 被 重 排 . 

关于 置换 矩阵 , 易 知 置换 矩阵 的 乘积 仍然 是 置换 矩阵 ,并 且 第 一 类 初等 变换 矩阵 即 
对 换 和 矩阵 显 然 是 特殊 的 置换 和 矩阵， 

定义 1.2.3 如 果 存 在 置换 矩阵 王 . 单位 下 三 角 和 矩阵 工 与 上 三 角 和 矩阵 U, 使 得 方 阵 A 
满足 


PA=LU (1 2, 的 
则 称 式 (1. 2. 8) 为 4 的 带 置 换 P 的 LU 分 解 ,或 矩阵 4 的 PA 二 LU 分 解 . 
1 一 1 2 
例 1.2.4 求 算 了 泗 A== | 一 2 2 1| 的 PA=LU 分 解 . 
=3 1 3 
1 = 攻 和 人 1 宇 癌 一 证 
解 :A 二 | 一 2 2 1| ~ |0 0 5 0 一 2 9|=U 
一 3 1 3) x(3) (0 一 2 9 人 次 避 


显然 , RasRis (3)Ris(2)A4 二 U. 注意 到 Rs 二 I 一 Ez 一 Ess 十 zs 十 Ess, 结合 式 (1. 2. 7) 
可 知 ， 
Rs Ris(3)= (I— FE — Es Ez Es) (TH 3Ea) = I— FE — Es Es + Es + 3E2 
= (I 3Ea) (TI— Ey — Es 十 五 3 Es) = Ri (3)R,s 
R;; Ri (2)—=Ri; (2)R;; 
因此 ,UU 二 Rz3Ri3(3)Ri(2)A = Ri (3)R;ysRi(2)A = Ri (3)Ris(2)R;sA, 从 而 


1 0 0 LT 人 0 
Pp 一 R;; = 0 0 ] 9 L (Ri (3)R1s (2))7 一 Ri; (— 2)Ri, 一 3) 一 | 一 3 1 0 
1 六 一 号 0 1 


由 于 列 初等 变换 可 以 转化 为 行 初等 变换 ,因此 ,更 一 般 地 , 当 和 矩阵 A 仅 为 可 首 方 
阵 时 ,我 们 可 以 先 通 过 某 些 置换 和 矩阵 P 对 4 的 行进 行 重 排 ,然后 就 可 以 使 用 LU 分 
解 了 . 
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定理 1.2.3 ( 列 主 元 LU 分 解 定理 ) 对 nr 阶 可 北方 阵 A, 存在 置换 矩阵 P、 单位 下 三 
角 和 矩阵 工 与 上 三 角 和 矩阵 U, 使 得 PA 二 LU. 

证 明 : 对 阶 可 道 方 阵 A, 考察 由 其 前 一 1 列 构 成 的 nx (n 一 1) 子 和 矩阵 ,其 nn 个 n 一 1 
阶 子 和 矩阵 中 必 有 一 个 是 可 逆 的 ,否则 将 14| 按 第 列 拉 普 拉 斯 展开 后 , 易 知 |4| = 二 0, 这 
与 4 可 逆 相 矛盾 . 通过 置换 矩阵 P! (显然 Pi 未 必 唯 一 ,为 什么 ?) 将 4 中 的 这 个 可 道 的 
nn 一 1 阶 子 矩阵 行 置换 到 一 1 阶 主子 矩阵 的 位 置 , 从 而 4 二 PiA 的 n 一 1 阶 主子 矩阵 是 
可 逆 的 , 即 P14 的 第 n 一 1 个 顺序 主子 式 A i 和 0. 同样 ,如 果 有 必要 ,对 A 的 前 "一 1 行 ， 
也 可 以 通过 置换 矩阵 P;, 将 其 中 的 可 逆 的 ”一 2 阶 子 矩阵 行 置换 到 ?一 2 阶 主子 矩阵 的 位 
置 , 即 4; 二 Pohi 王 忆 PP4A 的 第 2 一 2 个 顺序 主子 式 A 关 0. 继续 这 个 过 程 , 可 得 置换 矩 
阵 P 了 二 P,P,。… Pi, 使 得 PA 的 所 有 顺序 主子 矩阵 式 全 部 可 道 , 即 PA 具有 LU 分 解 . 
证 毕 . 

根据 列 主 元 LU 分 解 定理 ,如 果 存 在 PA = LU, 那么 矩阵 三 可 逆 , 即 存在 可 道 矩 阵 


工 ，, 使 得 二 二 三 大 从 而 LiPA = 二 LLU = 二 =U, 即 


Li(PA.,T) = (LiPA vn) 3 (U.,L) 


这 也 就 意味 着 可 通过 对 (PA , 做 行 初等 变换 先 求 出 U 和 工 !， 进而 再 求 出 天 
一 阁 
例 1.2.5 能 和 否 求 矩 阵 4 = 4 5| 的 LU 分 解 ? 
5 6 

分 析 : 注 意 这 里 A = 1,A; 二 0,A; = 一 1, 即 As 二 0 不 满足 定理 1. 2. 1 的 条 件 , 但 矩 
阵 4 却 满足 定理 1. 2. 3 的 条 件 , 因 此 只 能 求 4 的 带 置 换 P 的 LU 分 解 . 

i 沟 2 4 

解 :由 于 A 的 前 2 列 中 的 三 个 2 阶 子 矩阵 中 ， (, 时 和 和 都 可 逆 , 因 此 P, 可 
取 Ri 或 Ra ,这 里 我 们 取 Pi = Ri;. (为 什么 没 取 忆 == R,; ?) 类 似 地 ,可 知 P; = 二 I. 因此 
P= P,P, = Ri;. 


1 
2 
8 


纺 汐 ] Qo Qlril—23 3 § 6 1 人 阁 
CPA,I)= |2 4 5 0 1 0 ~ 0 2/3 1 一 2/3 1 0 
1 B83 0 lt=173 1 一 1 0 1 
rzs(—1/2) [3 5 6 1 0 0 
一 - 9 1 一 2/3 1 0 三 (CU :Li) 
0 0 1/2 0 /多 1 
1 0 0 
从 而 上 = Li! = 12/3 1 01 ,于 是 所 求 的 PA 二 LU 分 解 为 
A A 
Q@ 和 时 但 儿 入 1 0 Or 3 6 
PA=|I0 1 0||2 4 5|= |2/3 1 I 2/3 1 |=LU (1. 2. 9) 
1 0 OJ\3 5 6 l/s 1/ WO wi /2 


对 PA 二 LU 两 边 求 行列 式 , 并 注意 到 |P|== 士 1, |L| 王 1, 因 此 
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土 |A4|=|P||A|=|P4A|=|LU|=|L||v|=|U| 


此 即 |A|== 士 |0|== 士 wiwzz……um ;这 说 明 可 通过 计算 U 的 对 角 元 之 积 即 主 元 之 积 
zitz2…ww 来 计算 A 的 行列 式 . 分 析 表 明 , 这 种 方法 的 时 间 复 杂 度 为 O(02 ) ,和 远 远 小 于 使 
用 拉 普 拉 斯 展开 定理 所 耗费 的 O(n1). 事实 上 ,Matlab 计算 行列 式 的 内 置 函 数 det 就 是 
基于 LU 原理 来 实现 的 . 

当 系数 矩阵 4 可 首 时 ,显然 存在 置换 矩阵 P, 使 得 PBA = LU, 从 而 线性 方程 组 hx 二 b 
就 变 成 了 PAx 二 LUx = 二 LUx) = Pb, 这 说 明 此 时 我 们 也 可 以 通过 求解 两 个 特殊 的 三 角 
方程 组 Ly 二 Pb ,Ux 一》 了 来 求解 线性 方程 组 4Ax 二 b. 


0 1 
例 1.2.6 (小 主 元 带 来 的 误差 危害 ) 考虑 线性 方程 组 hx 一 b, 这 里 A 二 (” 1， 


5 一 (-), 其 理论 解 为 一 ( ， ) 如 果 系数 算 了 被 扰动 成 一 人 ) , 手 算 可 知 它 的 
1 LO 2 ] 
元 = ,每 三 
1020 | 0 1 区 1020 


假设 机 器 精度 为 es= 10“. 根据 浮 点 运算 的 规则 , 即 两 数 相 加 时 ,大 数 “ 吃 掉 ” 小 数 
(请 参阅 1. 3 节 ), 则 在 口中 的 元 素 1 一 102 中 ,大 数 102%“ 吃 掉 ? 了 小 数 1, 因 此 产生 的 浮 点 


矩阵 为 A ==A,L = 二 LL,U i el 虽然 对 于 接近 方 的 矩阵 4 (这 里 水 一 去)， 
它 的 LU 因子 L'、U’ 非常 接近 理论 上 的 因子 .0, 即 LU 分 解 是 稳定 的 . 但 显然 此 时 

人 | 与 大 明显 不 同 ,因为 在 (2,2) 位 置 上 ,未 中 的 1 变 成 了 LU 中 的 0. 现 
在 LU'x 二 5 的 理论 解 x 一 (0,1)7, 显然 不 等 于 前 面 的 理论 解 x= (一 1,1)7, 而 且 x' 明 
显 不 接近 x, 这 说 明 将 LU 分 解 用 到 解 线性 方程 组 hx 一 尺 上 时 是 不 稳定 的 . 究 其 原因 ， 
是 因为 口中 的 第 一 个 主 元 10 太 小 ,导致 第 二 个 主 元 中 1 与 10” 的 值 相 差 悬 殊 , 出 现 了 
“大 数 吃 小 数 "的 情况 ， 

如 果 5 也 被 扰动 成 了 一 1,10 7, 则 此 时 扰动 方程 组 为 A 一 5, 妈 

1 


LU = 


lo™ 3 


“1 2: 10) 


1 1 1 02 


经 计算 易 知 其 理论 解 为 x 二 (一 1,1 十 10“)", 与 扰动 前 的 理论 解 x 二 (一 1,1)7 非常 接 
近 . 然而 按 高 斯 消 元 法 , 则 有 


一 20 —20 
(A,b) = 9 l ! 2 C— LO Wy 1 1 
jl 1 10* 0 1—10* 102— 10% 
5 Ee 1@ 1 ] 
在 浮 点 运算 中 ,后 者 变 成 了 | 10。 0 | , 因此 数值 解 为 心 = 1,zi 一 0 , 显 


然 z 的 数值 解 0 与 扰动 前 的 理论 解 一 1 的 误差 也 非常 大 . 这 恰似 著名 的 “蝴蝶 效应 ”: 蝴 
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蝶 仅 仅 拍 动 了 一 下 翅膀 , 却 导 致 万 里 之 外 的 一 场 看 风 . 其 罪魁 祸首 ,仍然 是 第 一 个 主 元 
10” 太 小 ,导致 第 二 个 主 元 1 一 10” 中 1 与 102 的 值 相差 悬殊 . 

如 何 避 免 上 述 危 害 呢 ? 联想 到 前 面 的 置换 技巧 ,我 们 在 消去 的 过 程 中 ,可 以 通过 适 
当 的 选 主 元 技术 ,以 避免 放大 数据 误差 . 常用 的 选 主 元 技术 就 是 列 选 主 元 法 : 

对 mXn 阶 矩阵 A, 在 确定 第 & 个 主 元 z 史 〈 广 三 &) 时 , 先 从 该 列 自 主 元 位 置 (&,ji) 
至 列 尾 的 所 有 元 素 a ，… ,a 中 选择 绝对 值 最 大 的 元 素 , 与 ay 交换 ,然后 将 a 由, ,…， 
4 风化 为 零 . 继续 这 个 过 程 , 直 至 将 矩阵 4 化 成 其 行 阶梯 形 百 ^. 

特别 地 ,对 可 逆 方 阵 4, 最 后 得 到 的 是 上 三 角 和 矩阵 U. 另外 , 列 选 主 元 法 可 保证 消去 
时 的 乘 子 都 不 超过 1, 这 明显 抑制 了 数据 误差 的 放大 和 传播 . 

由 定理 1.1.2 可 知 ,对 m Xn 阶 矩 阵 4 及 其 行 阶梯 形 Ha, 列 选 主 元 法 意味 着 存在 
m 阶 可 首 和 矩阵 R', 使 得 RA 二 Ha，, 即 存 在 mm 阶 可 逆 和 矩阵 R (这 里 R 二 CR ) ,使 得 


G | i 
A 二 RH4. 将 Ha 及 R 分 别 分 块 为 Ha 一 [a ,R= 二 (F,F), 其 中 G 为 /Xn 阶 行 满 秩 算 
阵 , 为 m Xr 阶 列 满 秩 矩阵 , 即 x(F) = r(G) 一 这 里 r= 二 xr(4) 为 矩阵 4 的 秩 , 则 


A=RHa= (F,F) 


[a 
(=ro=m (这 了 和 
O 


式 (1. 2. 11) 称 为 矩阵 4 的 满 秩 分 解 (full rank decomposition) , 即 任意 矩阵 可 分 解 
为 列 满 秩 矩阵 与 行 满 秩 矩 阵 的 乘积 . 
例 1.2.7 用 列 选 主 元 法 重 解 例 1. 2. 3. 
解 : 列 选 主 元 法 . 
3 1 600 1 0 on 
CE | 


一 —1 —s G0 1 mtdifay ly =218 a 1 WH 1 


ra(2/5)13 1 0 1 1 0 
~ |0 53 -1 -13 1 0=(UiL) 
0 0 —12/5 1/5 2/5 1 
1 0 0 
因此 L= 二 LL "= | 1/3 1 ”0|, 故 所 求 分 解 为 
—1/3 —2/5 1 
下 二 和 莉 1 gg of 1 0D 
= -ll=|y 1 ola Ws -1 |=10 
-1 —1 —2) 一 1a —2/5 lJlo 0 —12/s 


显然 , 手 算 结果 与 本 小 节 开 始 处 的 机 算 结 果 完 全 一 致 ,这 说 明 Matlab 内 置 函数 lu 分 
解 的 实现 算法 就 是 基于 列 选 主 元 法 .在 文献 [110] 中 , Matlab 的 创始 人 之 一 的 莫 勤 


第 1 章 线性 方程 组 。19 。 


(Cleve Barry Moler) 提 供 了 lutx 函数 , 即 lu 函数 的 可 阅读 版 本 ,从 中 我 们 不 难 发 现 这 个 
事实 : 
function [L,U,p] = lutx (A) 
% [L,U,pj 二 lutx(A) 产 生 单 位 下 三 角 和 矩阵 L, 上 三 角 和 矩阵 U, 以 及 排列 向 量 p, 使 得 L* U 二 Alp,:). 
[n,n] = size(A);p= (1:n)' 
for k= Ln 1 
% 查 找 第 k 列 中 自 对 角 元 至 列 尾 的 元 素 中 绝对 值 最 大 的 元 素 
[cm = max(abs (A(K:n,k))); m= m+ k- 1; 
% 跳 过 主 元 为 零 的 列 
if (A(m,k) ~ = 0) 
% 将 主 元 所 在 的 行 换 至 第 k 行 
if (m ~= k) 
A(CLk m],:) = A([m kl],:);p([k m]) = p([m k)]); 
end 
% 计 算 乘 子 
i= kt l:n; A(i,k) = Al(i,k)/A(k,k); 
% 更 新 矩阵 的 剩余 部 分 
j= kr 1:n; A(i,j) = A(i,j) - A(i,k)* A(k,j); % 占 用 运算 时 间 最 多 的 语句 
end 
end 
% 分 离 出 结果 L 和 
L= tril(A,- 1) + eye(n,n);U= triu(A); 


Matlab 中 还 提供 了 调用 格式 (注意 返回 的 矩阵 的 顺序 ): 
[L,U,P]= lu (A); 
用 来 计算 矩阵 4 带 置 换 P 的 PA 二 LU 分 解 . 对 例 1. 2. 5 中 的 和 矩阵 4, 机 算 可 知 结果 与 手 
算 一 致 . 
用 列 选 主 元 法 解 扰动 方程 组 (1. 2. 10), 可 知 


A 和 @ 了 本” 1 | J 1 10% 
P(A,b) = 一 
1 0 1 1 102 10 2 1 1 
rw(— 10 2 {10 2 1 10% 


ss 


0 1—10% 1—j0* 


从 而 易 知 其 解 为 X= (一 1,1 十 102)T. 

其 他 的 选 主 元 技术 还 有 全 选 主 元 技术 、 对 角 选 主 元 技术 、 随 机 选 主 元 技术 等 . 下 面 我 
们 用 全 选 主 元 技术 证 明和 矩阵 标准 型 定理 ,其 余 的 请 读者 查阅 文献 L[58,62,63,90] . 

定理 1.2.4 (和 矩 阵 标准 型 定理 ) 任 意 m Xn 阶 任意 矩阵 A 经 过 有 限 次 初等 变换 , 必 
能 化 成 如 下 形式 的 标准 型 (normal form) Na : 


| I r Oa | 
(9 Oi niXn 
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其 中 ,> 三 7r(C4). 另外 , 当 - 王 0 时 ,我 们 约定 五 为 零 矩阵 . 

证 明 : 我 们 的 证 明 实 际 上 就 是 全 选 主 元 法 . 

设 A = 二 (aj)wn; 车 4 二 0, 则 和 Ns 二 0, 结论 成 立 . 

若 4 和 0O, 如果 ai 不 是 矩阵 4 绝对 值 最 大 的 元 素 ,而 是 其 他 元 素 (例如 as ), 则 可 以 
通过 一 次 行 交 换 变换 和 一 次 列 交换 变换 将 之 换 到 第 一 行 第 一 列 ( 例 如 ms 和 ca ). 因此 不 
失 一 般 性 , 设 ai 就 是 矩阵 4 绝对 值 最 大 的 元 素 . 显然 此 时 cu 天 0. 


接 下 来 , 先 对 第 一 列 的 其 余 元 素 执行 倍加 变换 , 即 (一生) Gi 一 2,3,…,m); 再 对 
第 一 行 的 其 余 元 素 执行 倍加 变换 , 即 o (一 全 ) Gj 二 2,3,…,n); 然后 对 第 一 行 执行 数 乘 
变换 , 即 i (二 -). 显然 ,经 过 这 一 系列 变换 后 ,矩阵 A 就 变 成 了 如 下 的 形式 ; 


| 1 OO 


Oh sl A 1 


其 中 , 4 是 (m 一 1) x (一 1) 阶 和 矩阵 . 
对 A 重复 上 述 讨论 ， 由 于 m,n 都 是 有 限 数 ,因此 必定 存在 某 个 非 负 整 数 ,使 得 相 
应 的 矩阵 Gm 一 7) X (一 7) 阶 和 矩阵 4 是 零 矩 阵 . 证 毕 
由 和 矩阵 标准 型 定理 及 式 (1. 1. 4) 可 知 , 存 在 天 阶 可 逆 矩 阵 丸 ' 及 n 阶 可 逆 和 矩阵 C", 使 
得 R4C = NA, 即 存在 2 阶 可 逆 矩 阵 尺 (这 里 丸 一 CR) ) 及 郊 阶 可 道 矩 阵 C (这 里 C= 
(C )” ) ,使 得 矩阵 A 有 如 下 标准 型 分 解 (canonical decomposition ) : 
A = RNaC (1 .10 


对 于 任意 方 阵 , 甚 至 长 方 阵 , 有 的 没有 LU 分 解 , 有 的 却 有 无 穷 多 种 LU 分 解 ， 
比如 


0 2 1 心 i| | 久 骂 


& 1 Jl 1—2a 


其 中 ,a 为 任意 实数 . 可 见 并 非 都 是 “此 事 不 宜 措 (LU)”. 

因为 mxn 阶 矩 阵 A 总 能 通过 列 选 主 元 法 化 成 行 阶梯 矩阵 ,因此 形式 上 总 能 保证 PA 
二 LU, 当主 nn 时 ， LL 也 是 mm Xn 阶 和 矩阵 ,而 U 是 n 阶 方 阵 ; 当 m=n 时 ， 是 阶 方 阵 ， 
而 U 则 是 mx Xn 阶 矩 阵 . 例如 


& 6 LY/ 宛 1 0 《9 国生 枚 | 1 
5 
你 0 -本 | 莹 | 本 本 | 2 二: | | CE 
0 2/3 

1 © WIN 5 1/83 工作 j 区 天 二 L783 

Q 1ifi 2 a 1 © $F 6 
一 工业) 人 DELL 5 的 

1 Oll3 5 6 1/3 到 人 1 
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上 述 分 解 显然 可 看 成 分 解 式 (1. 2. 9) 的 约 化 (reduced) 形 式 了 ,而 且 适 当 扩充 后 ,可 变 
成 方 阵 的 情形 . 例如 


a 1 ® Wir 5 1 
o 1 dllg 4 Ol= |25 1 8 2/3 —2/8 
| 1/3 172 1J\@ 六 0 
G 本 yi 0 1 0 01f3 0 1 
0 1 0|l2 1 0l=|2/3 1 0|l0 1 —2/3 
1 € Ols 0 1 Hs O Id WW —1d8 
例 1.2.8 验证 分 块 矩 阵 的 下 列 LDU 分 解 : 
1) 主子 矩阵 4 可 逆 时 ,成 立 
AB I 0O]l[4 O I 4 
一 Cl, 1 
C 也 Ca TIO D-CA "BIO I 
《2) 右 下 角 的 子 矩 阵 卫 可逆 时 ,成 立 
AB I BD'|/A—BD'C 0O0||[I 0 
= (1. 2. 14) 
CD O I O DJLDIC I 


在 式 (1. 2.13) 中 ,我 们 称 和 矩阵 卫 一 C4 一 有 8 为 矩阵 和 的 Schur 补 (Schur comple- 
ment) ,而 在 式 (1. 2. 14) 中 ,我 们 称 和 矩阵 4A 一 BD-C 为 矩阵 D 的 Schur 补 . Schur 补 在 和 矩 
阵 理 论 .统计 分 析 ` 和 矩阵 计算 ,线性 方程 组 求解 .线性 系统 、 控 制 理论 等 领域 都 有 着 广泛 的 
应 用 . 


1.2.3 特殊 矩阵 的 LU 分 解 


特殊 矩阵 在 抢 阵 分 析 与 计算 中 扮演 着 重要 的 角色 ,甚至 可 以 说 ,具有 各 种 特殊 性 的 
和 矩阵 构成 了 这 个 领域 的 血 与 肉 . 从 大 的 方面 讲 , 特 殊 和 矩阵 可 分 为 特性 矩阵 和 特 型 矩阵 两 
大 类 (这 两 类 可 以 有 交集 ). 前 者 通过 具有 不 易 直观 识别 的 性 质 来 刻画 ,典型 的 有 可 道 矩 
阵 、 正 交 和 矩 阵 、 正 定 和 矩阵、 寡 等 矩阵 (42: 二 4 ) 等 ;后 者 则 可 以 通过 非常 容易 识别 的 结构 或 
模式 来 刻画 ,比如 三 角 和 矩阵 置换 矩阵、 对 称 矩 阵 、 带 状 矩 阵 等 . 这 里 我 们 将 把 笔墨 集中 在 
实 对 称 正定 矩阵 和 带 状 矩阵 的 LU 分 解 上 . 

我 们 知道 , 实 对 称 正定 矩阵 4 在 存储 上 可 节约 大 约 一 半 的 空间 ,那么 在 求解 以 这 样 
的 A 为 系数 矩阵 的 线性 方程 组 4Ax 二 b 时 ,是 否 也 能 利用 A 的 这 种 特殊 结构 减少 计算 
量 呢 ? 

当 4 为 交 阶 实 对 称 正 定 和 矩阵 时 ,其 所 有 顺序 主子 式 人 二 0 (k 二 1,2,…,n). 因此 ， 
根据 定理 1. 2. 2, 存 在 单位 下 三 角 和 矩阵 工 、 单位 上 三 角 和 矩阵 U 和 对 和 角 和 矩阵 也 , 使 得 


@ “ 约 化 "的 概念 ,在 3. 2 节 的 QR 分 解 以 及 4. 5 节 中 的 SVD 分 解 中 还 会 涉及 . 
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和 A= 二 LDU, 从 而 A' = 二 U"TDL', 这 里 U' 是 单位 下 三 角 和 矩阵 , 工 : 是 单位 上 三 角 和 矩阵 ， 
因为 A= A7, 故 A 二 LDU 一 UTDL' 一 47. 由 LDU 分 解 的 唯一 性 ,可 知 必 有 工 一 CT， 
U 王 三 , 此 时 显然 有 A 二 LDLT. 进一步 可 知 , 因 为 4 为 实 对 称 正 定 和 矩阵 ,因此 对 角 和 矩阵 
D = diagCdi ,ds，…,d,) 的 对 角 元 都 为 正 数 。 若 记 v 万 = D? = diag( Vdi, Vd，*…， 
Vd,), 则 有 


A = LD3DiLT = (LD3) (LDO)T = LL 


其 中 , Li = LDY 是 可 道 的 下 三 角 和 矩阵 . 
定理 1. 2.4 (Cholesky 分 解 定理 ) 设 4 是 实 对 称 正 定 和 矩阵, 则 存在 唯一 的 可 逆 下 三 
角 和 矩阵 工 , 使 得 
起 三 LT (1 2 15》 


式 (1. 2. 15) 就 是 实 对 称 正定 矩阵 A 的 Cholesky 分 解 ,也 常 写 成 4 二 CC 或 4 一 RR 
的 形式 ,其 中 的 G、R 都 为 可 北 的 上 三 角 和 矩阵 . 

有 了 Cholesky 分 解 后 ,对 称 正定 线性 方程 组 hx 一 b 即 对 称 正定 系统 的 计算 就 可 以 
转化 为 求解 LL'x 二 5b, 即 求 解 两 个 三 角 方 程 组 Ly 一 b,L'x 二 y. 这 要 求 我 们 先 对 矩阵 从 
做 LU 分 解 ,再 求 出 对 角 和 矩阵 D 和 Cholesky 分 解 因子 工 . 遗憾 的 是 ,分 析 表 明 , 这 种 方法 
并 未 利用 矩阵 的 对 称 性 来 减 小 运算 量 . 事实 上 ,下 面 介绍 的 平方 根 法 更 有 效 . 

考虑 矩阵 的 具体 元 素 ,将 式 (1. 2. 15) 写成 如 下 形式 : 


Ul CI2 Ul ln ln Lal ln 
U2]1 (28 U2 Lyi L22 { L 

站 二 = = 
Ca Un2 Cm 1 (a a pa ha 


利用 和 矩阵 乘法 规则 ,可 以 依次 计算 出 i; (i 三 7), 具 体 步 骤 如 下 : 
(1) 由 CI1l 一 可 知 li = Hi» 进而 由 aii = laln i22 ) 可 知 li 一 aa/lu; 


mg | 
(2) 当 lan » Lj2 » "°° 9 bj,j=1 已 求 出 时 ,由 Qj 一 后 十 诛 十 入 十 访 > 扩 十 如 可 知 
k=1 


EI 
2 一 玉民 
Ls /dj | 
k=1 


3 pe! | 
(3) 当 i>j 时 ,由 @y = 2 laly = 2 laln tll 可 和 ly = Gay 一 Dal) /ly. 
k=1 k=1 k=1 


六。 二: 1 6 
例 1.2.9 解 线性 方程 组 Ax = 二 b, 其 中 A 二 | 一 1 4.25 2.75|,b 二 | 一 0.5|. 
1 2.75 3.5 1. 25 


分 析 : 按 平方 根 法 可 知 ， ls 的 计算 顺序 应 该 为 : li — la —> La —> Ll», > [32 一 > Ls3. 
解 :由 于 A 二 A, 且 A 二 4 汪 >0,As 二 16 记 0,A;== |4|==16 守 0, 因此 A 对 称 正 
定 , 即 4 存在 Cholesky 分 解 . 
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bj 二 = 了 0.5, hi 一 去 一 0.5, ln 一 VE25 一 (一 0.5)7 一 2 


A 3 CD] gh = VE = 


2 
一 0.5 2 

0.5 1.5 1 
继续 求解 Ly 二 b 得 y 二 (3,0.5, 一 1)7, 再 由 Lix 一 可知 x 一 (2,1, 一 1)7. 


即 L= 


说 明 分 解 过 程 中 矩阵 工 中 的 元 素 的 数量 级 不 增长 ,因此 平方 根 法 是 数值 稳定 的 . 另外 ， 
平方 根 法 显然 不 必 选 主 元 . 但 即便 如 此 ,平方 根 法 仍 有 改进 空间 ,因为 其 中 用 到 了 开 方 运 
算 .事实 上 ,根据 分 解 A 一 LDL' ,有 LDL'x 一 b, 因此 可 先 解 Ly 一 六 再 解 L'x 二 Dy. 
这 种 方法 显然 就 避免 了 平方 运算 . 可 以 证 明 , 这 种 改进 的 平方 根 法 适用 于 任意 对 称 和 矩阵 
(未 必 正 定 ) ,除非 出 现 主 元 为 零 的 情况 . 

在 Matlab 中 ,提供 了 内 置 函数 chol 用 于 计算 A 的 Cholesky 分 解 ,具体 格式 为 


IL= chol (A, 'lower') 或 R= chol (A) 


楚 列 斯 基 (Andre-Louis Cholesky, 1875 一 1918， 
见 图 1- 5) 年 轻 时 曾 就 读 于 巴黎 综合 理工 学 院 了 ,受到 卡 
米尔 ， 约 当 ( 详 见 2. 5. 4 小 节 )、 齐 利 ， 贝克 勒 (Henri 
Becquerel,1852 一 1908, 因 发 现 放 射 性 获得 1903 年 诺 贝 
尔 物理 学 奖 ) 等 大 师 的 卫 陶 ,入 伍 后 在 军队 的 测绘 工作 
中 显露 出 敏锐 的 智力 和 显著 的 数学 才能 . 20 世纪 初 , 随 
着 巴黎 子午 线 的 修改 ,人 迫切 需要 对 法 国 重新 进行 三 角 章 
分 . 为 了 求解 用 最 小 二 乘法 拟 合 数据 时 产生 的 法 方程 ， 
他 提出 了 后 来 以 他 的 名 字 命 名 的 方法 . 他 死 后 ,他 的 一 


J 
由 于 一 2 友人 一 1,2 2), 而 性 之 0 因此， max，_ | 大 | 入 max Vay，, 这 
必 三 玉 ~J<n 


位 同事 在 1924 年 以 Cholesky 的 名 义 在 ( 测 地 学 快报 》 “四 用 
(Bulletin géodesique) 上 发 表 了 这 个 方法 ,但 未 引起 重 图 1-5 楚 列 斯 基 (1875 一 1918) 
视 . 二 战 中 ,杰克 。 托 德 (Jack Todd, 即 John Todd, 数 值 

分 析 与 计算 领域 的 先锋 性 人 物 《 数 值 数学 基础 》 的 作者 ) 在 伦敦 国王 学 院 将 之 引入 分 析 
课程 之 中 . 1948 年 ,福克斯 (Leslie Fox,1918 一 1992, 英 国 IMA 协会 设 有 以 他 命名 的 莱 斯 
利 ， 福克斯 数值 分 析 奖 )、 赫 斯 基 (Harry Douglas Huskey ,1982 年 计算 机 先驱 奖 获 得 
者 ,ENIAC 研制 组 骨干 成 员 之 一 ) 威 尔 金 森 (James Hardy Wilkinson,1919 一 1986) 合 作 
出 “关于 代数 线性 联 立 方程 的 解 的 一 些 注 记 (Cnotes on the solution of algebraic linear 
Simultaneous equations )” 一 文 ,分 析 了 这 个 方法 ,同年 ,图 灵 在 “矩阵 方法 中 的 舍 人 误差 ” 
中 研究 了 这 个 方法 的 稳定 性 . 


”这 是 一 所 军事 院 校 ,该 校 的 别名 “X” 表 示 未 知 数 x, 意味 着 数学 在 该 校 的 地 位 很 重要 . 
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例 1.2.10 (热传导 问题 ) 热 量 从 系统 的 一 部 
分 传 到 另 一 部 分 或 由 一 个 系统 传 到 另 一 个 系统 的 
现象 叫 热 传导 . 对 于 热传导 问题 ,重要 的 是 确定 稳 
定 状 态 下 的 温度 分 布 场 . 对 于 截面 (如 图 1- 6 所 示 ) 
为 矩形 薄片 的 导热 铁杆 ,假设 四 周 温度 已 知 ( 上 、 
下 ,左右 的 温度 分 别 为 0"、10"、5” 和 20” ), 则 其 截 


面 在 稳定 状态 下 的 温度 分 布 函 数 u(x,y) 满足 拉 普 zl Hy hs 
拉 斯 方程 图 1-6 网 格 点 选取 方案 (自然 排序 法 ) 
_au ou 
Mt (1. 2. 16) 


2 2 
其 中 A= 二 了 称 为 拉 普 拉 斯 (Pierre-Simon Laplace,1749 一 1827) 算 子 , 许 多 像 拉 普 


拉 斯 方程 这 样 的 偏 微分 方程 没有 或 难以 求 出 解析 解 ,因此 更 合理 的 希望 是 求 出 其 数值 
解 . 通过 在 水 平方 向 和 垂直 方向 分 别 作 两 族 步 长 为 h 的 平行 线 ,然后 采用 数值 解法 计算 
出 网 格 点 的 温度 近似 值 ,就 可 以 得 到 拉 普 拉 斯 方程 的 数值 解 . 首先 ,利用 泰勒 (Brook 
Taylor,1685 一 1731) 公 式 可 以 证 明 


f(z) 心 让 [f(z 十 各 一 2f(z) 十 f(z 一 有 )] 2] 


这 是 因为 f(t 土 有 ) = f(x) tf Dh+af rR 十 ol 如 ) ,从 而 有 


fz+h) fr mh) = 2fr) + fF xh’ olh’) 
略 去 高 阶 无 穷 小 oCh?), 并 稍 加 整理 , 即 可 得 出 式 (1. 2. 17). 
将 式 (1. 2. 17) 分 别 应 用 到 二 阶 偏 导数 ul ,y) 和 uy), 并 记 u(xzi,y;) 
二 wj， 则 
o’ o? 


J 1 
Li 全 PR, 2us 证 Zi js 2 全 大 Ca = 2us 二 iii1) 


Qz Oy 
将 上 式 代 入 拉 普 拉 斯 方程 (1. 2. 16), 即 得 “ 十 型 ”五 点 差分 格式 : 


J 
六 人 ly 二 wi,; — 4u; 十 zs 十 Ui,;) 二 0 


这 样 , 拉 普 拉 斯 方程 (1. 2. 16) 就 变 成 了 线性 方程 组 : 
Uy Fit — do un win; 一 0 (= 1,2;7 = 1,2,3) (1.2.18) 


并 且 Uoi 一 Wo2 一 Wo3 一 10 ,wu 一 Uzg 一 20° ss1 一 252 一 Was 一 0” yiaio 三 Uz0 一 5?. 
令 1 一 (Cayzsytasytuiytyzs)T,0 一 (15,10,30,5,0,20)T, 则 方程 组 (1. 2. 18) 变 
形 为 
4r 一 (1. 2. 19) 
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4 一 1 0 一 :1 
—1 4—1 0 一 1 
0 1 4—1 0 一 1 
其 系数 和 矩阵 4 二 a 是 带宽 为 7 的 带 状 矩阵 . 
1 0—1 4 一 1 
1 0—1 4 
定义 1.2.4 对 于 nn 阶 方 阵 A 二 (az), 若 当 | 一 川 之 2 时 ax 一 0, 且 至 少 有 一 个 
有 & 值 ,使 得 ws 天 0 或 ae 天 0 成 立 , 则 称 矩 阵 4 为 带 状 和 矩阵 (band matrix), 2 十 1 为 其 
带宽 (bandwidth), / 为 其 半 带 宽 (half bandwidth) ,并 且 称 其 对 角 线 为 第 0 条 对 角 线 ， 
往 上 依次 是 第 1 条 ,第 2 条 ,…, 第 /条 对 角 线 , 往 下 则 依次 是 第 一 1 条 ,第 一 2 条 ,…， 
第 一 条 对 角 线 . 
显然 ,对 角 和 矩阵 是 最 特殊 的 带 状 手 阵 , 带 宽 为 1. 另外 ,带宽 为 3 的 三 对 角 和 矩阵 也 很 常 
见 .一 般 地 ,我 们 希望 带 状 矩阵 的 带宽 远 远 小 于 其 阶 数 . 
Matlab 中 提供 了 语法 


A= diag (v, kK) 


来 生成 N 十 |&| 阶 的 方 阵 4, 其 中 向 量 v 的 维 数 为 N，, 其 元 素 依次 构成 4 的 第 & 条 对 角 线 
上 的 元 素 . 当 & = 0 时 可 使 用 缺 省 形式 的 语法 


A= diag (Vv) 
这 样 方 程 组 (1. 2. 17) 的 系数 和 矩阵 4 就 可 以 用 下 列 代 码 段 来 生成 : 
V= 4* ones(1,6);i= 1:1:5;vl= (- 1)* (rem(i,3)~ = 0);v2= (- 1)* ones(1,3); 


A= diag(v2,- 3)+ diag(vl,— 1)+ diag(v)+ diag (v1,1)+ diag (v2,3) 


因为 带 状 矩阵 结构 的 特殊 性 ,我 们 自然 希望 运算 过 程 中 能 保持 这 种 结构 , 即 保 结 
构 . 但 使 用 inv(A) 机 算 可 知 , 4 的 逆 矩 阵 4 不 再 是 带 状 和 矩阵 (虽然 4 可 看 成 带宽 为 
11 的 带 状 矩 阵 , 但 这 显然 毫 无 意义 ) ,实际 上 4 :中 没有 一 个 零 元 素 , 这 显然 增加 了 存 
储 空间 ,说 明 用 和 矩阵 求 递 法 解 方 程 组 (1. 2. 19), 不 是 一 种 保 结构 的 算法 . 可 是 对 A 使 
用 LU 分解 ,我 们 却 惊 喜 连 连 ,因为 算出 的 L 和 UU 不 仅 是 三 角 和 矩阵 ,而 且 仍 然 是 带宽 和 矩 
阵 ,带宽 为 4( 我 们 称 之 为 半 带 宽 和 矩阵 ). 使 用 LU 分 解 解 方程 组 (1. 2. 19) 的 代码 段 
如 下 : 


[L,U]= lu(A); u= U\(L\b) 


最 终 机 算出 的 结果 为 w= 二 (7. 0186, 8. 6646, 12. 0186, 4. 4099, 5. 6211, 9. 4099)T. 

这 些 结果 ,加 上 已 知 的 四 周 温度 ,就 构成 了 温度 分 布 函 数 u(x,y) 在 相应 网 格 点 温度 的 近 
似 值 . 我 们 可 以 借助 于 下 列 Matlab 代码 绘 出 其 图 形 : 

u= reshape (u,2,3) ”% 把 一 维 数组 u 变形 为 (2* 3) 二 维 数 组 ua 

up= [0 0 0] :down= [10 10 10];u= [upy u;down] % 加 入 上 下 的 初始 数据 

% 加 入 左右 的 初始 数据 , 角 点 的 温度 取 平 均 数 

left= [2.575 S5712.5] right= [10;207;20715];W= [left u right] 

x= 一 1:4;y= - 1:3;mesh (u, 'LineWidth',3) % 线 宽 设 为 3 
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结果 如 图 1-7 所 示 . 显然 图 中 的 图 形 非常 不 光滑 ,这 是 因为 网 格 点 取得 太 少 . 有 兴 
的 读者 请 适当 增加 网 格 点 数 后 ,再 重 绘 温度 分 布 场 u(x，,y). 


图 1-7 温度 场 u(x,y) 的 分 布 图 


例 1.2.11  ( 范 德 蒙 德 矩阵 的 LU 分 解 ) 设 zi ,zz ,zx3,… ,Zz 是 互 不 相等 的 实数 , 则 
二 阶 范 德 蒙 德 (Alexandre Théophile Vandermonde,1735 一 1796) 和 矩阵 


a 1 ee 1 1 
ZI1 Xs 0 xza 一 2 
因此 = (- py 从 而 V = LaU,. 
三 阶 范 德 蒙 德 矩阵 
1 下 1 17mz (一 2) {1 1 
V3= Iz Xs Xs ~ 和 gi—w ”wy 
XI ze zi)ris(—zxI)l0 zi—x? xi—x? 
ras(—i — sa) (1 1 1 
一 动 二 站 = 
0 0 (3 — 1 2 (08 一 2 
业 0 0 
于 是 Ls 王 |i 1 0| ,从 而 V3 == LsU;. 
x zi 二 xs 1 
一 般 地 ,类推 可 知 , ” 阶 范 德 蒙 德 矩阵 
上 1 1 
ee | I 
wi 大 ” 0 
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] 1 1 
En 0 3. ~ 人 Xn Xl Ea U, 
0 0 Cw (= He,t) 
1 0 0 0 
Xl 1 0 a 0 
并 且 LE; = 一 Xl 上 才 ; 1 : = 从 而 VV, 让 L, U,. 
时 a 0 
Zz 十 十 十 六 1 


思考 :一 般 地 , 2” 阶 范 德 蒙 德 矩阵 W, 的 求 逆 公 式 是 什么 ? 使 用 LU 分 解法 和 矩阵 求 
逆 法 求解 方程 组 wx = 5b, 熟 优 熟 劣 ? 


众所周知 ,运用 数学 理论 和 数值 方法 来 解决 实际 问题 ,一 般 要 经 历 这 样 几 个 阶段 : 首 
先是 建立 数学 模型 ,即将 实际 问题 归纳 .抽象 、 提 炼 为 数学 问题 ,用 合适 的 数学 模型 来 描 
述 , 并 分 析 与 求解 此 模型 ,以 得 到 问题 的 理论 解 或 解析 解 . 比如 要 计算 地 球 的 表面 积 ,就 
可 将 地 球 简化 为 一 个 球体 ,从 而 问题 就 转化 为 计算 球体 的 表面 积 ,然后 借助 于 微 积 分 知 
识 , 用 公式 S 二 4x 或 者 貌似 更 合理 的 S= xd? 来 加 以 计算 . 这 通常 被 认为 是 应 用 数学 学 
科 的 任务 . 不 幸 的 是 ,许多 数学 问题 难以 求 出 甚至 没有 解析 解 ( 比 如 例 1. 2. 10 中 提 及 的 
热传导 问题 ) ,而 数值 方法 却 是 求解 它们 的 现实 之 道 . 这 就 催生 了 第 二 阶段 的 任务 , 即 根 
据 所 选择 的 数学 模型 及 已 有 的 理论 分 析 , 提 出 求解 的 算法 ,编写 出 合适 的 程序 ,并 上 机 调 
试 出 结果 . 一 言 以 项 之 ,这 个 阶段 涉及 算法 的 设计 、 分 析 与 实现 . 这 通常 被 认为 是 计算 数 
学 学 科 的 任务 . 随 着 计算 机 科学 与 技术 的 蓬勃 发 展 , 近 几 十 年 来 ,不 仅 应 用 数学 与 计算 数 
学 的 学 科 界 限 逐 渐 模 糊 , 它 们 甚至 与 计算 机 学 科 相 互 融合 ,逐渐 孕育 并 结晶 出 数值 计算 
(numerical computing) 技 术 或 内 涵 更 广泛 的 科学 计算 (scientific computing) 技 术 . 这 就 
要 求 我 们 两 手 都 要 硬 : 既 要 学 会 理论 分 析 , 又 要 掌握 数值 算法 . 考虑 到 这 两 者 的 思维 方式 
有 时 其 至 南 辕 北 略 ( 比 如 行列 式 的 理论 计算 方法 与 数值 算法 ) ,使 得 这 一 点 尤为 重要 . 只 
有 如 此 ,我 们 才能 具备 初步 的 科学 计算 能 力 . 


1.3.1 计算 机 的 浮 点 数 系统 与 舍 入 误差 


在 数值 计算 过 程 中 ,不 可 避免 地 会 产生 误差 ,它们 主要 有 以 下 几 种 : 

(1) 模 型 误差 , 即 建 立 数学 模型 的 过 程 中 ,由 于 抽象 及 简化 实际 问题 而 带 来 的 偏差 . 
比如 地 球 明明 是 个 鸭 梨 ,你 偏 说 它 是 个 圆 球 ,这 就 产生 了 模型 误差 . 事实 上 ,模型 误差 往 
往 是 所 有 误差 中 最 大 的 ,而 且 难 以 依靠 数值 算法 来 修正 . 比如 若 将 地 球 看 成 长 方 体 , 那 就 
廖 以 千里 ,无 论 怎么 算 ,都 会 对 不 上 号 的 . 

《2) 观 测 误差 , 即 由 于 观测 工具 ,测量 手段 ,时空 和 测量 人 员 等 方面 的 局 限 性 给 数学 
模型 中 的 参数 带 来 的 误差 . 比如 测量 地 球 的 半径 时 ,无 论 测量 工具 和 手段 怎样 先进 ,误差 
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都 是 不 可 避免 的 . 当然 ,这 种 误差 与 相关 学 科 有 关 ,科学 计算 中 一 般 不 予 研究 . 

(3) 截 断 误差 ,也 称 方法 误差 , 即 用 数值 方法 得 到 的 近似 解 与 数学 模型 的 精确 解 之 间 
的 误差 . 比如 在 式 (1. 2. 15) 中 ,我 们 用 泰勒 多 项 式 f(x) 士 /CCz)U 十 大 (zz) 尼 /21 近似 代 
禁 了 f(x 土 h), 从 而 产生 了 截断 误差 o(12). 在 例 1. 2. 10 中 ,利用 泰勒 公式 ,我 们 还 可 以 
得 到 “ X 型 ”五 点 差分 格式 


pd Tit — hy + ir, 十 win,it1) 一 0 


(4) 舍 人 误差 , 即 由 于 计算 机 的 字 长 有 限 , 导 致 原始 数据 在 计算 机 上 表示 时 产生 的 误 
差 , 这 种 误差 在 计算 过 程 中 可 能 又 会 产生 新 的 误差 . 例如 用 有 限 小 数 3. 14 或 3. 14159 近 
似 代替 无 理 数 x, 就 产生 了 伟人 误差 x 一 3.14 或 x 一 3.14159. 

当然 , 舍 入 误差 远 没有 这 么 简单 , 它 与 数 在 计算 机 上 的 表示 方式 有 密切 关系 . 让 我 们 
先 从 计算 机 的 浮 点 数 系统 说 起 . 

在 计算 机 发 展 的 早期 ,各 国 开发 的 计算 机 都 有 自己 的 浮 点 数 系统 ,有 二 进 制 的 ,有 十 
进 制 的 ,或 许 由 于 冷战 的 原因 ,苏联 甚至 开发 出 一 种 三 进 制 的 计算 机 . 随 着 冷战 氛围 的 逐 
浙 消 散 ,IEEE 联合 各 大 学 、 计 算 机 制造 商 、 数 学 家 、 计 算 机 科学 家 和 工程 师 ,历时 十 年 ,于 
1985 年 发 布 了 ANSI/IEEE 754 号 标准 . 如 今 ,这 个 标准 已 经 成 为 整个 计算 机 行业 中 单 精 
度 和 双 精 度 运算 的 共同 标准 . 

在 IEEE 754 标准 中 , 浮 点 数 (floating point number) 由 三 部 分 组 成 , 即 符号 (十 或 
一 )、 尾 数 和 阶 (也 称 指数 ). 浮 点 数 有 三 种 常用 的 精度 等 级 , 即 单 精度 、 双 精度 和 长 双 精 
度 ,所 占 二 进 制 数位 分 别 是 32(4 字 节 ,其 中 符号 占 1 位 、 阶 占 8 位 ,尾数 占 23 位 )、64(8 
字 节 ,其 中 符号 占 1 位、 阶 占 11 位 ,尾数 占 52 位 ) 和 80(8 字 节 ,其 中 符号 占 1 位 、 阶 占 15 
位 .尾数 占 64 位 ). 

实际 的 浮 点 数 系 统 下 都 采用 了 规格 化 技术 ,这 意味 着 非 零 浮 点 数 x 可 以 表示 为 


F = | 让 二 士 (1 十 放 。27 ee 1. didsds*""d, . 27) 


其 中 ,1 不 必 存 储 ;尾数 f 为 小 数 0. didzds…qd,, di、dz、d3、…、d, 取 值 为 0 或 1, 为 尾数 
的 长 度 ; p 为 指数 , L 过 pp 三 U, LU 分别 是 指数 的 上 、 下 界 . 显然 , 浮 点 数 系统 下 由 i,L， 
U 唯一 确定 , 即 F = 二 F(t,L,U). 

Matlab 中 使 用 的 是 IEEE 双 精 度 格式 ,其 中 , t 二 52,L = 一 1022,U 二 1023, 并 通过 
存储 p 十 1023 避免 了 考虑 指数 pp 的 正 负 号 ,这 里 的 数 1023 == 2 一 1 被 称 为 指数 偏 移 Cex- 
ponent bias) ,注意 1023 二 2" 一 1 = 2 一 1, 其 中 , s 二 11 为 指数 的 二 进 制 位 数 . 由 于 采 
用 :位 二 进 制 数 表示 指数 p ,并且 1 达 p 十 1023 过 27 一 2, 因此 余下 两 个 特殊 的 指数 值 0 
和 2" 一 1, 它们 被 用 于 表示 浮 点 数 的 特殊 值 . 

例 1.3.1 (一 个 简单 的 浮 点 数 系统 ) 考 虑 下 一 F(2, 一 1,4), 图 1-8 标 出 了 下 中 的 
所 有 24 个 正 浮 点 数 ( 加 上 对 应 的 负 浮 点 数 和 0, FF 中 共有 2 X 24 十 1 = 49 个 浮 点 数 ). 
这 些 浮 点 数 不 是 等 间隔 分 布 的 ;但 在 相 邻 的 2 的 整数 次 究 之 间 , 浮 点 数 是 均匀 分 布 的 . 
男 外 ,最 小 的 正 浮 点 数 为 2 = 1/2, 最 大 的 正 浮 点 数 则 为 25001 一 2 ) 一 28. 还 有 就 
是 0 与 最 小 的 正 浮 点 数 之 间 的 间隔 较 大 ,这 是 规格 化 带 来 的 后 果 . 
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图 1-8 浮 点 数 系统 下 二 F(2, 一 1,4) 


在 系统 下 二 F(2, 一 1,4) 中 ,大 于 1 的 最 小 浮 点 数 是 5/4, 它 与 1 的 差 s 王 2 一 1/4 
被 称 为 此 系统 的 机 器 精度 (machine epsilon, 有 的 书 上 的 定义 与 此 不 同 ). e 或 e/2 通常 被 
称 为 此 系统 的 伟人 误差 级 别 . 比如 ,实数 0. 7823 介 于 两 个 浮 点 数 3/4 与 7/8 之 间 ,但 更 靠 
近 3/4, 因此 被 伟人 到 3/4, 其 舍 人 误差 为 0.7823 一 3/4 = 0.0313 一 s/2. 

显然 ,无 论 在 怎样 的 计算 机 上 ,下 二 FG,L,U) 都 是 一 个 有 限 集 , 因 此 实数 集中 几乎 
所 有 的 实数 都 要 被 舍 人 到 下 中 与 之 相近 的 浮 点 数 ,从 而 产生 伟人 误差 . 这 也 说 明 舍 和信 误 
差 是 不 可 避免 的 . 因此 ,真正 理解 含 入 误差 及 其 在 算法 中 的 传播 和 对 最 终 计算 结果 的 影 
响 ,甚至 被 当做 初步 具备 科学 计算 能 力 的 重要 标志 . 

回 到 Matlab 中 的 IEEE 双 精 度 格式 ,其 浮 点 数 系统 为 下 二 (4, 一 1022,1023)，, 机 器 
精度 为 s = 2“? (Matlab 中 用 常量 eps 来 表示 ) ,大约 是 2. 2204 X 1074 . 

浮 点 数 加 减 的 规则 :指数 相同 时 ,加 减 尾 数 ;指数 不 同时 ,将 其 中 较 小 的 数 的 尾数 缩 
小 以 使 两 个 数 的 指数 匹配 . 缩小 尾数 相当 于 在 存储 字 节 内 将 数据 后 移 , 这 自然 会 造成 有 
效 数 字 位 数 的 减少 ,使 得 计算 结果 不 准确 . | 

考察 代码 段 


format long; a= 4/3; b= a- 1; c= 3* b; d= 1- c 
如 果 精 确 计 算 ,d 的 值 为 0, 但 使 用 浮 点 数 ,输出 的 却 是 eps 的 值 : 
2. 220446049250313e 一 016 
这 是 因为 


4 _ 人 
人 


22 


十 入 十 章 十 X22 


因此 a 被 伟人 到 双 精 度 机 器 数 


加 oll 1111 1111 0101 0101 0101 0101 0101 0101 0101 0101 0101 0101 0101 0101 0101 


其 中 ,第 1 个 二 进 制 位 表示 浮 点 数 的 正 负 号 (0 为 正 数 ,1 为 负数 ) , 接 下 来 的 11 位 表示 的 
是 偏 移 后 的 指数 (由 于 p= 二 0, 因此 它们 表示 的 是 bp 十 1023 = 1023 ) ,余下 的 就 表示 尾数 ， 
将 这 个 机 器 数 写成 十 六 进 制 ,就 是 3ff5555555555555, 这 在 Matlab 中 可 以 通过 先 输入 命 
令 format hex, 回 车 后 再 输入 4/3 来 检查 . 而 1 的 机 器 数 为 3ff0000000000000, 从 而 根据 
浮 点 数 的 运算 规则 ,a 与 1 的 差 b 没 有 舍 入 ,形式 上 应 该 是 0005555555555555, 但 经 过 调 
整 , 其 指数 变 为 p = 一 2 ( 偏 移 后 为 p 十 1023 二 1021 ) ,其 尾数 前 移 2 位 (未 尾 补 0), 即 b 
为 3fd5555555555554. 执行 乘法 3* b 时 ,采用 的 是 2* b 十 b 的 处 理 方式 ,其 中 2xb 为 
3fe5555555555554, 因 此 b 被 调整 为 3feaaaaaaaaaaaaa. 这 样 乘积 c 就 是 3feffffffffffffe, 这 
样 最 终 得 到 的 差 d= 二 1 一 c 就 是 3cb0000000000000, 即 机 器 精度 eps. 
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前 文中 提 到 的 两 个 特殊 的 指数 值 0 和 2" 一 1, 当 j 太 一 0 且 户 三 二 = 一 1022 时 ,对 应 
最 小 的 正规 化 浮 点 数 ; 当 了 二 0.111…116) 且 p= 二 U 二 1023, 对 应 最 大 的 正规 化 浮 点 数 . 
在 Matlab 中 ,两 者 分 别 被 称 作 realmin 和 realmax, 前 者 的 值 为 2 , 即 十 六 进 制 的 
0010000000000000; 后 者 的 值 为 (2 一 e)2"2, 即 十 六 进 制 的 7fefffffffffffff, 具 体 的 十 进 制 
实数 为 2. 225073858507201e 一 308 和 1. 797693134862316e 十 308. 这 里 要 注意 的 是 ， 
realmin 比 eps 小 得 多 。 

如 果 计 算 结 果 大 于 realmax, 则 出 现 * 上 溢出 ”现象 . 此 时 计算 结果 称 为 无 穷 大 ,在 
Matlab 中 用 Inf 表示 , 它 对 应 的 是 上 =0 且 z=1024 的 情形 , 即 十 六 进 制 的 
7ff0000000000000. Inf 满足 关系 1/Inf 二 0 及 In{ 十 In{f 二 Inf. 另外 ,在 Matlab 中 定义 了 一 
个 “ 非 数 ”, 用 NaN 表示 ,其 十 六 进 制 为 ff8000000000000, 对 应 了 = 0. 111… 11w 、2 一 
U 二 1023 且 符 号 位 为 1 的 情形 . 比如 0/0 和 Inf 一 Inf 的 计算 结果 都 是 NaN. 

如 果 计 算 结 果 小 于 realmin, 则 出 现 “ 下 溢出 ”现象 .但 由 于 0 与 最 小 的 正 浮 点 数 之 间 
的 间隔 较 大 ,因此 IEEE 标准 中 定义 了 一 种 次 规范 化 规则 ,在 指数 取 最 小 值 时 , 允许 尾数 
的 首位 取 0. 具体 到 Matlab 中 ,就 是 取 p= 二 一 1023, 这 样 偏 移 后 的 指数 就 是 2 十 1023 = 0. 
此 时 ,最 小 的 正 的 次 规范 数 ,表示 成 十 六 进 制 ,就 是 0000000000000001, 即 2 2 X 2 -2 一 
2 ,大约 是 4. 9407e 一 324, 任 何 小 于 它 的 正 数 都 伟人 到 0. 

假设 二 是 一 个 略 小 于 机 器 精度 s 的 正 浮 点 数 , fL(，) 表示 一 个 数学 表达 式 按 浮 点 数 
运算 规则 所 得 计算 结果 ,显然 (1 十 x) 二 1, 出 现 了 “大 数 吃 小 数 ” 的 现象 , 即 两 个 操作 数 
大 小 悬殊 时 , 较 小 的 数 (这 里 的 xz ) 的 信息 将 被 较 大 的 数 ( 这 里 的 1 六 吞噬 ”《 伊 索 寓言 》 
里 蚊子 尚 能 战胜 狮子 ,但 小 数 碰 到 大 数 ,就 只 能 鸣 呼 衰 哉 了 . 当然 如 果 采 取 适 当 技 巧 ,是 
可 以 避免 被 员 区 的 命运 的 . 例如 ,车 计算 1 十 2z 的 浮 点 数 ,按照 

RT RRO 二 UD =©1 


小 数 22 仍 不 免 落 入 狮 口 , 但 若 按 及 十 (z 十 zx)) 1 来 计算 ,小 数 2z 就 能 幸免 于 难 . 

抵消 现象 也 是 浮 点 数 系统 中 的 一 个 重要 问题 . 例如 两 个 十 进 制 的 5 位 精度 数 相 减 
1. 9876 X10 一 1. 9723 X10 二 1. 53, 得 到 结果 却 只 有 3 个 有 效 数 字 ,而 计算 过 程 中 并 未 
舍 和 人. 

有 的 抵消 现象 也 可 通过 适当 技巧 (比如 改变 计算 公式 ) 加 以 避免 . 例如 当 z 之 y 时 ,可 
考虑 以 下 公式 : 


1 区 二 叉 
一 -一 一 "arctanzr 一 arctany 王 arctan 
V 工 十 Vy ly 
例 1.3.2 (这 是 多 项 式 曲线 吗 ?) 考 虑 下 列 Matlab 代码 : 
X= 0.988:.0001:1.012; 
y= X.^7- 7* X.^6+ 21* X.^5- 35* x.^4+ 35* x.^3- 21* x.^2+ 7* x- 17% 注 意 元 素 群 运算 ,- 


lInx— lny= 1n ~ iv 一 Vy 


plot (x, y) 
其 运行 结果 如 图 1 -9 所 示 . 显然 曲线 非常 不 光滑 ,完全 不 像 是 一 条 多 项 式 曲 线 . 究 其 
原因 ,其 实 是 舍 人 误差 的 的 鬼 . 若 改 用 代码 


y= (x- 1) .^7 
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来 计算 y 的 值 ; 则 回归 平常. 
另外 ,两 数 相 除 时 ,车 除数 的 绝对 值 远 小 
于 被 除数 的 绝对 值 ,也 会 增 大 伟人 误差 ,甚至 
导致 上 洪 . 换 一 个 角度 看 ,这 也 意味 着 两 数 相 
乘 时 , 若 其 中 一 个 乘 数 的 绝对 值 远大 于 另 一 个 
乘 数 的 绝对 值 , 也 会 增 大 舍 入 误差 . 实际 计算 
时 ,要 尽 可 能 调整 运算 次 序 , 以 避免 这 种 情况 
出 现 . 例如 ,在 例 1. 2. 6 中 , 使 用 高 斯 消 元 法 
时 ,由 于 第 一 个 主 元 10-2 太 小 ,导致 消 元 时 所 
用 的 乘 子 一 102 的 绝对 值 太 大 ,最 终 影响 到 了 
数值 解 的 准确 性 . 因此 , 消 元 时 我 们 要 极力 避 1 -9》 这 也 算 多 项 式 曲线 ? 
免 小 主 元 的 出 现 . 当然 ,这 并 不 是 说 我 们 不 能 选取 小 的 乘 子 . 事实 上 , 列 选 主 元 法 中 , 乘 子 
的 绝对 值 都 小 于 1. 


1. 3.2 ”问题 的 病态 性 与 算法 的 稳定 性 
我 们 从 一 个 经 典 问题 谈 起 . 
例 1.3.3 (算法 的 稳定 性 ) 计 算 积分 二 一 | .zeridz (n= 0,1,2,…). 


和 


A bb 2 0 2 Nw an um 
~ =- 一 一 


ER _ 4 
0.99 0.995 1 1.005 1.01 1.015 


[= 
mn 
史 
a 


解 : 由 分 部 积分 法 可 知 一 | z"de™ 二 ze | 一 | nr"memidzr 一 1 一 贡 ,1, 即 有 
递 推 式 

LS= = (1.3. 1 

由 于 初始 值 有 = | wedz 一 1 一 el ,代入 式 (1. 3.1), 即 可 依次 求 出 荆 ,T,… 的 


值 . 问题 是 这 只 是 理论 分 析 的 想法 ,在 实际 的 数值 计算 时 会 出 现 荒 廖 的 结果 . 我 们 取 四 位 
小 数 来 详细 分 析 . 
由 于 五 中 涉及 无 理 数 e, 故 用 泰勒 公式 允 近 e@ 1!, 即 


se1T 十 (一 ]) 十 前 i 4 :二 半生 1 
当 训 二 7 时 ,得 @ 之 0.3679, 即 五 盖 五 一 0.6321, 此 时 截断 误差 为 Rj 二 |e 1! 一 0. 3679| 
三 二 三 十 X101, 同时 递 推 式 (1.3.1) 变 成 
i, =0.6321 ,7,=1—ni,: (n= 1,2,°) Cl, oy 


按 式 (1. 3. 1) 递 推 计 算 的 结果 见 表 1 - 1. 显然 ,其 中 的 I 二 0, 这 与 一 切 理论 值 工 二 0 
相 矛 盾 ， 实际 上 ,根据 定 积分 的 估 值 定理 , M 一 maxe 一 1,m 一 mine™! 一 ce ,而 


<X 
"1 
| "ds = -1 从 而 
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1 


十 (1 B38 


1 1 
a= m| es ot < <M| zdz 


表 1-1 积分 /== | er'dr 的 两 种 算法 


0. 3679 | 0. 2642 | 0. 2074 | 0. 1704 | 0. 1480 | 0. 1120 | 0. 2160 |—0. 7280| 7. 5520 


算法 2 | 0. 6321 | 0. 3679 | 0. 2642 | 0. 2074 | 0. 1709 | 0. 1455 | 0. 1268 | 0. 1121 | 0. 1035 | 0. 0684 


为 什么 算法 1 的 计算 结果 越 来 越 荒 廖 ( 比 如 五 =7.5520 之 1, 这 明显 不 靠 谱 )? 这 是 
因为 算法 1 从 一 开始 就 存在 误差 we = J 一 Io = 一 Ri, 而 


@ 一 工 一 下 = 人 1 一 下 人) 一 (1 一 并 1) 王 一 7e (1. 3. 4) 
因此 e, = 一 ne 三 (一 07) (一 (2 一 1))e ss = 二"… 二 (一 1)”mnleo. 初始 误差 被 积累 和 传 


播 后 , 竟 被 放大 21! 倍 , 差 若 毫 厘 , 纪 以 千里 ,因此 算法 1 是 不 稳定 的 . 

换 一 种 思路 . 注意 到 由 式 (1. 3. 4) 可 知 ev 二 一 (1/n)e,，, 因此 如 果 能 先 算出 1,, 那 
么 1 1 的 误差 ei 就 缩小 为 1 的 误差 e, 的 1/n. 这 意味 着 我 们 可 以 采用 如 下 的 倒 推 计算 
格式 : 


i = 二 (1 一 1,) 0 1 (1. 3. 5) 


问题 转化 为 必须 寻找 一 个 “好 ”的 五 . 由 式 (1. 3. 3) 可 知 0.1.e 一 五 二 0.1, 因此 
可 取 上 下 界 的 平均 值 , 即 令 7, 二 (0.1，@ 十 0.1)/2 有 0.0684, 于 是 由 式 (1. 3. 5) 可 依 
次 算出 1 ,Ts，…, 了 ,1o, 结果 见 表 1 一 1. 尽管 初始 值 I。 比较 粗糙 ,但 由 于 误差 是 逐步 缩 
小 的 ,因此 算法 2 是 稳定 的 . 

定义 1.3.1 如 果 一 个 数值 算法 的 输入 数据 有 误差 ,而 计算 过 程 中 误差 不 增长 , 则 称 
该 算法 是 稳定 的 (stable) ,否则 ,就 称 该 算法 是 不 稳定 的 (unstable). 

显然 算法 的 稳定 性 (stability) 反 映 了 使 用 该 算法 进行 计算 的 过 程 中 ,扰动 对 计算 结 
果 的 影响 程度 ,因此 是 算法 的 一 个 重要 属性 . 我 们 努力 寻求 的 ,就 是 误差 逐步 衰减 (至 少 
是 不 扩散 ) 的 稳定 性 算法 . 稳定 与 否 显然 是 我 们 评价 算法 优 劣 的 一 个 重要 指标 因素 . 

通过 例 1. 2. 6 我 们 看 到 ,不 选 主 元 的 高 斯 消 元 法 是 不 稳定 的 . 至 于 列 选 主 元 法 , 虽然 
对 某 些 矩阵 是 高 度 不 稳定 的 ,但 这 样 的 矩阵 数量 相当 少 ,因此 列 选 主 元 法 至 少 在 统计 意 
义 下 是 稳定 的 . 

在 矩阵 计算 中 ,还 经 常 涉 及 向 后 误差 分 析 法 . 

定义 1.3.2 向 后 误差 (backward error) 指 的 是 一 种 初始 误差 , 它 是 由 将 结果 误差 折 
算 而 得 来 的 . 向 后 误差 分 析 (backward error analysis) 考 察 的 就 是 这 种 初始 误差 即 原始 数 
据 的 摄 动 或 扰动 对 最 终 计 算 结 果 的 影响 . 

以 求解 线性 方程 组 Ax 二 5 为 例 ,假定 数值 解 为 x, 向 后 误差 分 析 法 就 是 将 x 看 成 对 
A 及 bb 分别 扰 动 AA 及 Ap 后 所 得 的 精确 解 , 即 (4 十 A4)x = 二 5b 十 作 , 其 中 Ax 二 x 一 x 就 
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是 向 后 误差 . 我 们 会 在 5. 3. 2 节 进 行 详细 讨论 . 

威 尔 金森 在 20 世纪 60 年 代 利用 向 后 误差 分 析 法 对 高 斯 消 元 过 程 中 的 舍 入 误差 进 
行 了 仔细 分 析 , 并 最 终 得 出 了 关于 高 斯 消 元 法 的 稳定 性 的 结论 . 他 的 伟大 工作 极 大 地 夯 
实 了 矩阵 计算 的 理论 根基 ,拓展 了 和 矩阵 计算 的 理论 深度 . 

桓 侯 之 疾 尚 在 胰 理 .肌肤 .肠胃 之 间 时 , 尚 可 应 之 以 汤 蚁 、 针 石 . 火 齐 等 术 . 一 旦 疾 入 
上 骨髓, 纵 神医 扁 静 , 亦 无 奈何 也 . 在 数值 计算 中 ,屡屡 让 我 们 “无 奈何 ”的 就 是 各 种 病态 的 
问题 . 

定义 1.3.3 对 于 一 个 数值 问题 ,如 果 输 入 数据 的 微小 变动 会 引起 输出 数据 ( 即 问题 
的 解 ) 的 很 大 扰动 (误差 ) , 则 称 这 个 问题 是 病态 的 (ill-conditioned) 或 敏感 的 (sensitive) ; 
反之 ,这 个 问题 就 是 良 态 的 (well-conditioned) 或 稳定 的 . 

显然 , 例 1. 2. 6 中 的 方程 组 Ax 二 b 就 是 一 个 良 态 的 问题 ,因为 用 列 选 主 元 法 计算 
其 扰动 方程 组 (1. 2. 10), 得 到 的 解 为 x 二 (一 1,1 十 10-2)T, 与 扰动 前 的 理论 解 
x 三 (一 1,1)" 非常 接近 .事实 上 ,在 Matlab 中 ,x 被 舍 和 人 到 了 x, 扰动 的 影响 已 经 完全 被 
忽略 了 . 

例 1.3.4 (系数 矩阵 几乎 不 可 逆 的 线性 方程 组 ) 考 虑 求解 线性 方程 组 Ax 一 b， 
其 中 


1 .99 1 


0..39 1 


Xz2 


显然 , x 二 (50. 251, 一 49.749)". 将 两 个 系数 0. 99 都 扰动 成 0.991, 则 可 得 x 三 
(55. 807, 一 55. 304)T, 误差 e 一 x 一 Xx 一 (一 5.555,5. 556)7. 系数 矩阵 元 素 上 仅 有 0. 001 
的 误差 ,而 计算 结果 的 误差 却 被 放大 了 5 千 多 倍 。 究 其 原因 ,是 因为 |4| = 0. 0199 0， 
即 4 几乎 不 可 道 ,从 而 此 方程 组 几乎 无 解 . 


最 有 名 的 病态 矩阵 恶 怕 非 Hilbert 矩阵 召 莫 属 ,其 元 素 为 局 一 二 一 J. Matlab 中 


提供 了 内 置 函数 hilb 可 用 于 生成 Hilbert 矩阵 ,比如 代码 hilb(3) 生 成 的 就 是 三 阶 
Hilbert 矩阵 


计量 
1 3 3 
| 1 1 
H= | 3 
1 1 1 
3 5 


在 矩阵 计算 中 存在 着 大 量 病态 问题 ,对 它们 的 求解 需要 构造 出 特殊 的 算法 ,当然 ,天 
下 没有 免费 的 午餐 ,这 些 算法 会 消耗 更 多 的 资源 . 

我 们 要 特别 强调 的 是 ,病态 与 良 态 或 “好 ”与 “ 坏 ” 是 数值 问题 本 身 所 固有 的 ,是 骨髓 
层面 的 问题 ,与 算法 无 关 . 稳定 的 问题 与 稳定 的 算法 是 不 可 混为一谈 的 . 

稳定 性 与 现代 控制 理论 中 的 鲁 棒 性 (robustness, 又 称 健壮 性 ) 也 极 易 混淆 . 在 现代 


。34 。 矩阵 分 析 与 计算 


控制 理论 中 ,所 谓 鲁 棒 性 ,是 指控 制 系统 在 一 定 (结构 , 大 小 ) 的 参数 摄 动 (扰动 ) 下, 维 
持 某 些 性 能 的 特性 ,也 就 是 系统 在 内 部 结构 发 生 扰 动 的 情况 下 ,外 部 干扰 抵御 能 力 的 
保持 能 力 , 其 着 眼 点 在 于 这 个 控制 系统 . 对 鲁 棒 性 的 研究 , 主要 限于 线性 定常 控制 


1.3.3 算法 的 计算 复杂 性 


计算 复杂 性 在 1. 1. 2 小 节 中 已 详细 讨论 过 ,这 里 仅 再 举 两 个 例子 . 

正如 1.2 节 所 述 ,初等 行 变换 法 即 高 斯 消 元 法 本 质 上 是 矩阵 的 LU 分 解 . 如 果 消 
去 过 程 中 还 需要 实施 矩阵 行 的 交换 , 则 相应 的 列 选 主 元 法 本 质 上 就 是 矩阵 的 PA== 
LU 分 解 . 

例 1.3.5 (未 进行 行 交 换 的 高 斯 消 元 法 的 复杂 性 分 析 ) 考 虑 用 高 斯 消 元 法 求解 线 
性 方程 组 hx = b 的 过 程 ,其 中 A 为 n 阶 可 逆 和 矩阵 , 且 有 LU 分 解 和 = LU. 

先 考虑 消 元 过 程 . 假设 消 元 过 程 中 出 现 的 主 元 都 不 为 0, 并且 经 过 第 步 消 元 后 ,方程 
组 变 成 4%x 二 b* (k= 二 0,1,2,…,n 一 1), 其 中 40 = A,b" 一 及 显然 4"? = 二 UU. 

当 上 二 1 时 ,由 于 第 1 个 主 元 af? 关 0, 因此 我 们 依次 取 n 一 1 个 乘 子 m 一 一 < 名 /af 
(i 二 2,3,…. n)，, 并 通过 变换 ri;(ma)，, 将 第 1 列 中 的 n 一 1 个 元 素 中 都 变 为 0, 从 而 得 
到 422x 三 久 2 ， 即 


(0) (0) (0) i (0) (0) 
CI11 Ql2 U13 Clin Xl ol 
) ) 
0 a a a | | zx» bs 
(1) ) 
0 4 CQ 六 和 | | wy | = | 区/ 
(1) Ys (1) ; (1) 
0 Un? Cn3 Um ‘Tn Do 


一 般 地 ,在 第 有 步 消 元 时 ,由 于 第 一 1 个 主 元 a 后? 关 0, 因此 我 们 依次 取 ”一 上 个 乘 
子 mx 二 一 a /a2 (i 二 上 十 1,… yn 一 1,n)，, 并 通过 变换 (ma), 将 第 上 列 中 的 nn 一 


a (k—1) S 不 (ph) 
& 个 元 素 a 拓 ”都 变 为 0, 从 而 得 到 4%x 一 b%, 即 
(0) (0) 本 C0) (0) i (0) 、 (0) 
Cl1 CC12 Ulk 1,kHl Uln Xl Obi 
) 1) (1) ) 
0 a 吻 WE a U2pt a X2 bs 
|| 认 
i (k) Be (k) 人 
0 0 0 CA Qn k+l [ME 
(k) (k) 
0 Qi 0 CR ®% Um 3 Be 


显然 ,在 第 & 步 消 元 时 ,每 个 乘 子 mx 涉及 1 次 除法 、 变 换 ri Gm) 中 的 nn 一 十 1 次 乘 
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法 (不 必 考 虑 mi 与 主 元 x 敌 ” 相 乘 的 一 次 乘法 ,但 需 计 和 人 mi 与 0 信 ” 相 乘 的 一 次 乘法 ) 及 
n 一 上 十 1 次 加 减法 (同样 不 必 考 虑 a 和? 与 mxa 人 ?之 间 的 一 次 加 减法 ,但 需 计 入 6 ”与 
mab4，? 之 间 的 一 次 加 减法 ) , 即 共 需 22 一 2k 十 3 次 运算 . 这 样 , n 一 个 乘 子 的 总 运算 量 
就 是 (n 一 &) (2n 一 2k 十 3) 次 . 再 考虑 到 消 元 的 总 步 数 为 2 一 1 步 , 则 消 元 过 程 的 总 运算 量 
就 是 


一 


Ni= 3 A)(22 一 2 十 3) = >) [2 (nm—k):+3(n—R)] 
k 二 nk=1 
= ep 十 31) 二 忆 太 十 二 太一 下 


再 考虑 回 代 过 程 . 此 时 求解 的 是 三 角 方程 组 4” ?x 二 b”?, 令 bw， 二 y, 此 即 
Ux 二 参考 例 1. 2. 1 后 的 复杂 性 分 析 可 知 , 回 代 过 程 的 总 运算 量 为 N = ee 


n 一 i 十 1) 二 ,因此 高 斯 消 元 法 的 总 运算 量 为 N= 二 Ni 十 N: 一 和 十 与 > 722 和 n, 即 其 
时 间 复 杂 度 为 T(n) 一 O(n ). 

高 斯 消 元 法 本 质 上 是 矩阵 的 LU 分 解 ,而 LU 分 解 显然 不 必 回 代 . 在 消 元 过 程 的 运算 
量 中 ,我 们 只 要 去 掉 涉 及 常数 列 的 运算 量 , 即 在 第 & 步 消 元 时 ,每 个 乘 子 mx 涉及 1 次 除 
法 .变换 痰 (Cox ) 中 的 7 一 上 次 乘法 及 宛 一 上 次 加 减法 . 这 样 ,矩阵 4 的 LU 分 解 的 总 运算 


量 N Sm Se Say 时间 复杂 度 仍然 为 Tn = OEY. 


思考 : 乘 子 mx 与 矩阵 世 中 的 元 素 i 之 间 是 什么 关系 ? 求 出 矩阵 U 的 同时 是 否 也 就 
求 出 了 和 矩阵 工 ? 

例 1.3.6  ( 秦 九 韶 算 法 ) 继 续 考 虑 例 1. 3. 2 中 多 项 式 y= 二 (zx 一 1)" 的 计算 . 

一 般 地 ,多 项 式 > 三 cl 十 cz 十 cs 夺 十 cz 十 cz 可 改写 为 

y= 二 a 十 xX{cz 十 xX[Lcs 十 zc 十 (cs))j》 (C1. 86 

我 们 可 以 从 里 往外 进行 计算 . 注意 ,此 时 系数 是 降 寡 变化 的 , 即 从 cs 逐次 降 到 a. 分 
析 可 知 , 式 (1. 3. 6) 中 只 需 4 次 乘法 和 4 次 加 法 ,因此 计算 一 个 4 次 多 项 式 的 值 ,通常 内 
需 24 次 的 运算 量 . 这 种 方法 称 为 能 套 乘法 (nested multiplication). 据 此 可 编写 自 定义 的 
nest 图 数 如 下 : 


function y= nest (d,c,x) 


= Tl(adt 1); 
for i= d:-1:1l,y= y. * x+ c(i); end % 注 意 小 黑 点 


程序 中 借助 Matlab 中 向 量 记 法 的 无 颖 处理, 采用 了 元 素 群 运算 “. * ”, 使 得 nest 函 


数 能 够 计算 一 组 多 项 式 值 . 在 此 基础 上 ,我 们 用 下 列 代 码 重 新 计算 y 的 值 ,得 到 的 多 项 式 
曲线 如 图 1 - 10 所 示 . 


i 和 矩阵 分 析 与 计算 


-4 
0.985 0.99 0.995 1 1.005 1.01 1.015 


图 1-10 秦 九 韶 算法 


hold on;x = 0.988: .0005:1.012;y= [ ];d= 7; % 步 长 改 为 0.005,d 为 多 项 式 的 次 数 
syms t;c= sym2poly((t- 1)^7); % 获 取 多 项 式 的 系数 ( 降 寡 排列 ) 

c= fliplz(c) % 将 多 项 式 的 系数 转变 成 升 寡 排列 

y= nest (dcyx); % 调 用 自 定义 函数 nest 

plot (x,y, '*') % 绘 出 的 仍然 是 心电图 ,但 比方 法 一 平滑 


在 西方 ,人 们 将 这 种 方法 归功 于 堆 纳 (William 
George Horner,1786 一 1837, 他 还 证 明了 平面 几何 中 
著名 的 蝴蝶 定理 ) ,但 最 近 又 有 学 者 指出 男 有 其 人 . 事 
实 上 ,这 个 方法 是 中 国人 提出 的 ,确切 地 说 应 该 称 为 
秦 九 韶 算 法 ,因为 南宋 数学 家 秦 九 韶 ( 见 图 1 -11) 在 
其 《 数 书 九 章 》(1247 年 成 书 ) 中 ,通过 求解 “ 尖 田 求 积 ” 
等 问题 ,已 明确 提出 了 一 种 * 正 负 开 方术 ”, 其 实质 就 
是 利用 舱 套 乘法 求解 高 次 方程 ,这 上 比 西方 早 了 五 百 多 
年 . 当然 , 秦 九 韶 的 成 就 远 不 限于 此 . 在 我 国 古籍 《 孙 
子 算 经 》( 约 成 书 于 四 五 世纪 ,作者 不 详 ) 中 ,有 个 “ 物 
不 知 数 ” 问 题 :“ 今 有 物 ,不 知 其 数 ,三 三 数 之 剩 二 ,五 
五 数 之 剩 三 ,七 七 数 之 剩 二 , 问 物 几 何 ?” 这 是 现代 数 


论 中 求解 一 次 同 余 方程 组 的 问题 ,被 称 为 "中国 剩余 es 
定理 ”, 其 一 般 形 式 为 1- 11 秦 九 部 (1208 一 1261) 的 传记 
NR; (mod 271; ) (i = 1,2,.…,n) 1. a VR] 


其 中 ,ma ,ms ,…,m， 是 两 两 互 素 的 正 整数 . 方程 组 (1. 3. 7) 的 解 为 


N= > MMR， (modm) (1. 3. 8) 


1 一 1 
其 中 ,mm 二 m2, Mi 王 m/m;, MM ' 二 1 (mod mm) ,i 二 1,2,…,n. 秦 九 韶 在 其 《 数 
书 九 章 ) 中 ,提出 “大 衍 求 一 术 ”, 系统 地 解决 了 中 国 剩余 定理 . 
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线性 方程 组 求解 .最 小 二 乘 间 题 .特征 值 问 题 是 数值 线性 代数 (又 称 矩 阵 计算 ) 
的 三 大 基本 问题 . 正如 前 面 我 们 所 看 到 的 ,线性 方程 组 的 求解 几乎 与 人 类 文明 同行 ， 
因而 历史 最 为 悠久 ,也 最 源远流长 ,这 也 催生 了 各 种 各 样 的 方法 ,它们 五 花 八 门 、 争 
奇 斗 艳 . 

按 使 用 的 基本 思想 ,数值 计算 大 体 上 可 分 为 直接 法 和 和 迭代 法 . 所 谓 直 接 法 (direct 
method) ,就 是 假定 在 计算 过 程 中 没有 舍 人 误差 ,而 且 理 论 上 只 需要 经 过 有 限 步 计 算 就 能 
得 到 精确 解 的 解法 . 这 类 方法 特别 适用 于 中 小 型 问题 . 至 于 和 迭代 法 (iterative method), 则 
是 不 直接 求 出 精确 解 ,而 是 通过 一 个 近似 序列 逐步 逼近 问题 的 精确 解 ,因为 此 序列 的 极 
限 才 是 问题 的 精确 解 ,因此 只 经 过 有 限 次 运算 一 般 得 不 到 精确 解 . 

线性 方程 组 的 数值 解法 自然 也 可 如 此 分 类 . 不 过 对 于 线性 方程 组 hx 二 6 的 求解 问 
题 ,一 般 还 按 系 数 和 矩阵 A 的 阶 数 或 维 数 ,将 之 划分 为 中 小 规模 的 问题 (比如 和 矩阵 的 阶 数 不 
超过 1000) 和 大 规模 的 问题 . 这 是 因为 随 着 维 数 增加 ,我 们 将 很 快 面临 “ 维 数 灾难 (curse 
of dimensionality, 又 译 为 “ 维 数 之 响 ”)” 如 何 化 解 “ 维 数 灾难 ”, 是 目前 各 类 工程 和 科学 
计算 对 数值 线性 代数 研究 的 热切 期 盼 ,也 是 当前 的 研究 热点 . 当然 ,矩阵 4 是 否 为 特 型 或 
特性 矩阵 ,也 是 重要 的 考虑 因素 . 尤其 是 大 规模 矩阵 ,一 般 都 具有 各 种 特 型 和 特性 结构 ， 
比如 稀疏 性 ( 即 4 中 非 零 元 素 很 稀 玻 ,一 般 不 超过 10%) 、 对 称 性 、 带 状 性 ,等 等 . 这 自然 就 
催生 了 各 种 保 结构 算法 . 

我 们 在 线性 代数 中 学 到 的 各 种 解 线性 方程 组 的 方法 (比如 前 面 提 到 的 “四 休 金 花 ”)， 
以 及 LU 分 解 和 后 文中 要 学 习 的 Jordan 分 解 、.QR 分 解 .SVD 分 解 等 方法 ,都 可 归 入 直接 
法 之 列 . 这 些 方法 一 般 都 涉及 矩阵 分 解 , 即 将 矩阵 分 解 为 几 个 特殊 矩阵 的 乘积 ,从 而 将 一 
般 线 性 方程 组 的 求解 问题 转化 为 几 个 特殊 线性 方程 组 的 求解 问题 . 完成 矩阵 分 解 的 途径 
最 终 都 会 落实 到 初等 变换 , 即 通过 各 种 变换 将 矩阵 A 变 成 特殊 矩阵 ,比如 LU 分 解 就 是 
把 A 变 成 上 三 角 和 矩阵 U, 相似 对 角 化 就 是 通过 相似 变换 (打包 ”后 的 初等 变换 ) 把 实 对 称 
和 矩阵 变 成 对 角 和 矩阵 , 正 交 对 角 化 则 是 通过 正 交 变换 (特殊 的 相似 变换 ) 把 实 对 称 和 矩阵 变 成 
对 角 和 矩阵 . 这 些 方 法 的 算法 复杂 性 分 析 一 般 就 是 计算 或 估算 算法 的 运算 量 ,如 我 们 对 “四 
人 打 金 花 ”" 和 高 斯 消 元 法 的 分 析 . 当然 ,由 于 舍 和 误差 的 存在 ,纯粹 意义 上 的 直接 法 是 不 存 
在 的 . 要 特别 注意 的 是 ,直接 法 也 可 用 于 求解 大 规模 问题 . 对 于 稀 玻 的 大 规模 线性 方程 
组 ,直接 法 的 基本 思想 仍然 是 高 斯 消 元 法 ,但 需要 考虑 " 填 人 现象 ,而且 算法 设计 和 实现 
都 涉及 很 多 技巧 . 因此 ,目前 的 一 种 趋势 是 采取 结合 策略 , 即 东 合 直接 法 和 迭代 法 各 自 的 
优势 ,如 线性 方程 组 求解 的 预 处 理 迭 代 法 . 

不 动 点 迁 代 (fixed-point iteration) 指 的 是 用 迭代 方程 = p(x) 或 迭代 格式 x“ 三 
2Cx”) 迭代 产生 近似 解 序列 


(k) 


(0) 
和 ,ok ye 


(01) (2) 
， [2 


x 


这 样 , 当 x 收敛 于 x” 即 x% 一 x” 时, x" 就 是 满足 迭代 方程 x = 二 g(x) 的 不 动 点 
(fixed-point). 


x ~ 


。38 ， 和 矩阵 分 析 与 计算 


类 似 地 ,用 迭代 法 求解 线性 方程 组 时 ,必须 把 hx = 二 b 转化 为 迭代 方程 x 二 PCz)， 显 
然 p(x) 必须 保持 “线性 性 ”, 即 它 必须 是 向 量 x 的 “线性 函数 ”: p(x) 一 Bx 十 f ,其 中 算 
阵 如 为 常数 矩阵 , 称 为 迭代 和 矩阵 (iteration matrix). 此 时 , 送 代 方程 为 x 二 Bx 十， 过 
代 格 式 为 


DD = Bx 了 (k=0,1,2,..) ;入 1》 
显然 ,对 迭代 法 来 说 ,必须 注意 以 下 问题 : 
如 何 构造 迭代 序列 ? 


@ 构 造 的 迭代 序列 是 否 收敛 ? 何 时 收敛 ? 

如 何 刻画 并 比较 各 种 方法 收敛 的 快慢 ? 

@ 近 似 解 的 误差 估计 ,等 等 . 

当然 ,如 何 构造 迭代 格式 ,存在 着 千差万别 的 方法 . 按照 所 用 的 思想 及 提出 的 时 间 ， 
我 们 可 将 线性 方程 组 求解 的 欠 代 法 大 致 划分 为 古典 迭代 法 和 现代 和 迭代 法 . 前 者 主要 依据 
矩阵 分 裂 技巧 ,后 者 是 基于 投影 的 子 空 间 迭 代 法 ,包括 Arnoldi 法 、Lanczos 法 和 共 恩 梯 
度 法 ,等 等 . 

如 今 , 几 乎 所 有 的 数值 计算 软件 都 具有 求解 线性 方程 组 的 功能 . 早期 ,它们 使 用 的 是 
线性 系统 软件 包 LINPACK (LINear system PACKage) ,目前 则 多 为 线性 代数 软件 包 
LAPACK (Linear Algebra PACKage). 这 两 个 软件 包 基 本 上 都 采用 了 部 分 选 主 元 技术 ， 
可 处 理 单 精度 和 双 精 度 的 实 ( 复 ) 矩 阵 . 

LINPACK 是 Matlab 的 创始 人 莫 勒 等 人 于 1974 年 起 用 Fortran 语言 编写 的 软件 
包 , 旨 在 帮助 他 们 的 学 生 使 用 当时 的 超级 计算 机 , 目前 大 部 分 功能 已 经 被 LAPACK 超 
越 . LAPACK 是 免费 的 程序 包 , 可 用 于 求解 线性 方程 组 .最 小 二 乘 问 题 . 特 征 值 问题 和 奇 
异 值 分 解 . 它 也 提供 了 LU 分 解 `.QR 分 解 .Cholesky 分 解 和 Schur 分 解 等 矩阵 分 解 的 实 
现 程序 . LAPACK 最 初 是 用 FORTRAN 77 实现 的 ,但 在 2008 年 已 更 新 为 FORTRAN 90. 
LAPACK 的 程序 在 少量 限制 和 约束 下 ,也 几乎 可 以 作为 C 函数 来 使 用 . 各 种 用 C 十 十 实现 
的 LAPACK CT 十 十 和 Armadillo C 十 十 (基于 模板 编程 技术 ) 目 前 也 正在 演化 中 . 

LAPACK 的 底层 使 用 了 基本 线性 代数 子 程序 BLAS(Basic Linear Algebra Subpro- 
grams). BLAS 是 一 个 应 用 程序 接口 (API) 标 准 , 用 以 规范 发 布 基础 线性 代数 操作 的 数 
值 库 ( 如 矢量 或 矩阵 乘法 ). 该 程序 集 最 初 发 布 于 1979 年 ,并 用 于 建立 更 大 的 数值 程序 包 
(如 LAPACK). 在 高 性 能 计算 领域 ,BLAS 如 今 已 被 广泛 使 用 . 

按 实现 功能 ,BLAS 被 分 为 三 个 级 别 : 

(1) BLASI 的 计算 复杂 度 是 O(n)，, 涉及 向 量 的 数 乘 \ 点 积 和 向 量 的 更 新 (注意 返回 
的 是 向 量 ) ,例如 x 一 ax、a 一 x'y 和 saxpy 运算 yy 一 ax 十 y; 

(2) BLAS2 的 计算 复杂 度 是 O(02 ), 涉及 和 矩阵 向 量 乘 法 或 向 量 的 外 积 运 算 ( 注 意 返 
回 的 是 矩阵 ) ,例如 gaxpy 运算 y 一 Ax 十 y 和 外 积 修正 A < 4 十 xyT; 

(3) BLAS3 的 计算 复杂 度 是 Ol), 涉及 算 阵 乘法 ,例如 矩阵 相 乘 的 修正 C<- AB 十 C. 
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习 题 一 
证 明定 理 1. 1.1 和 定理 1. 1. 2. 
证 明定 理 1. 2. 2. 
求 下 列 矩 阵 的 LU 分 解 和 PA 王 LU 分 解 : 
2 3 4 2 3 4 
(1)A=|l1 1 9 | (2)A=|3 5 | 
1 ， 混 ， 二 自 4 30 
2 1 2 一 下 3 
(3)A=|4 2 0|; (4)A=|l1 2 1|. 
6 名 2 4 2 


2X1 十 3zz 二 :475 = ls 
利用 LU om 十 zz 十 9xs 一 一 7， 
Cr 十 2xz 一 6z3 -= 9. 


0 1 
矩阵 A 二 (， ，) 能 否 进行 LU 分 解 ? PA 一 LU 分 解 呢 ? 为 什么 ? 


设 入 是 秩 为 r 的 nn 阶 答 阵 , 且 As 了 闫 0( 上 一 1,2,sr) ,证明 :存在 LU 分解 
A = 二 LU, 且 L 或 U 是 可 送 和 矩阵. 
5 “一 人 0 
求 对 称 正 定 和 矩阵 4 一 | 一 2 3 一 1| 的 Cholesky 分 解 . 
I 


求 三 对 角 和 矩阵 A = 


0 
1 
3 
| 的 LU 分 解 . 
0 


一 一 OO 


1 
0 
0 
1 
4 


OO OO ~ ~ 


设 人 是 可 逆 矩 阵 , 证 明 =|A| .|D—CA-1B|. 


A B 
| 
设 和 A 为 mXn 阶 答 阵 , B 为 nXm 阶 矩阵 ,证 明 |1, 一 AB| 二 |1, 一 BA| ,并 给 出 
m 二 1 时 的 情形 . 

写 出 7 阶 范 德 蒙 德 矩 阵风 的 求 北 公式 ， 
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伟大 的 罗素 (Bertrand Russell,1872 一 1970) 曾 经 别 叹 道 : “发现 一 对 鸡 两 昼夜 都 是 2 
的 实例 ,一 定 需要 很 多 年 代 , 其 中 所 包含 的 抽象 程度 确实 不 易 达 到 . 的确, 寓言 里 的 猴子 
就 没 弄 明白 “ 朝 三 着 四 ”与 “ 朝 四 暮 三 ”的 相同 之 处 ,因为 其 实质 是 加 法 交换 律 , 即 a 十 4b 三 
b 十 a. 在 《原始 思维 中 , 列 维 - 布 留 尔 (Levy-Bruhl,Lucien,1857 一 1939) 则 认为 “原始 人 ” 
的 思维 是 具体 的 思维 , 亦 即 不 知道 因而 也 不 应 用 抽象 概念 的 思维 ,因此 “原始 人 的 智力 过 
程 ,与 我 们 惯 于 描述 的 我 们 自己 的 智力 过 程 是 不 一 致 的 ”. 撤 开 他 的 是 非 功 过 不 谈 , 他 的 
研究 说 明 抽 象 思维 对 我 们 可 谓 功 莫大 看 . 而 在 以 高 度 的 抽象 性 著称 的 数学 中 ,抽象 更 是 
扮演 着 重要 的 角色 . 


2.1 从 解 空 间 到 向 量 空间 
和 Dd 


Wi 


2.1.1 从 齐 次 线性 方程 组 的 求解 谈 起 

让 我 们 先 从 “原始 人 ”做 起 . 众所周知 ,求解 线性 方程 组 Ax = 0 的 通 解 时 ,我 们 
不 仅 要 把 系数 矩阵 A 化 成 行 阶梯 形 Ha, 还 要 乘胜追击 ,将 Hs 进一步 化 到 行 最 简 矩 
阵 Us. 


ii 业 闪 二 间 
i 才 一 人 一 

例 2 工 1 解 齐 次 线性 方程 组 hx 一 0, 其 中 4 一 | | 。 。 5| 
—9 
3 二 高 后 一 闻 


由 行 最 简 和 矩阵 Us, 得 同 解 方程 组 
XI 一 一 27z3 — zy + 27s 
已 = xs — dm 十 xs 
令 x3 二 Ci ,x 二 Cz ,zxs 二 C3, 则 得 方程 组 的 通 解 
ZX1 =—2Ci—Cs2Cs,xs = Ci— CC ,xs 一 Clz = Csxs 一 Cs 
写成 列 向 量 形式 ,就 是 
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Xl 一 号 一 2 
沈 1 一 沪 1 
无 三 |zs|=G| 1 |4G| 0 | 十 Gel10 三 Gu C0 Cs0s. 
Xa 0 1 0 
Xs 0 0 | 


显然 , 选 好 解 向 量 组 wi ,os ,os 后 , 通 解 即 为 该 向 量 组 的 一 切线 性 组 合 的 集合 
号 三 {以 | X 一 Ci 十 Cs@2 十 Cs@a sl \C2 ,Ca 所 R } 


我 们 称 这 样 的 S 为 方程 组 Ax 二 0 的 解 空间 (solution space) 或 矩阵 4 的 零 空间 (null 
space). 显然 ,对 任意 x 二 Ci@ 十 Ca 十 Caos ES、 yy 一 Coi 十 Co 十 Caas ES 及 
&E R, 有 


x 十 了 一 (CI 十 Co 十 (C 十 C2)eas 十 (C: 十 Ci)os ES 
和 (EkC1 )ai 二 (kCs)@; 十 CRC3 )0s EE S 


这 说 明 集 合 S 对 向 量 的 线性 运算 ( 即 加 法 和 数 乘 ) 封 闭 , 即 : 
(mn €E SO €S; 
(2) vu € Sy ES 一 十 ES. 
Matlab 中 提供 了 内 置 函数 null, 用 于 求解 矩阵 的 零 空 间 . 要 得 到 上 面 的 结果 ,还 必须 
提供 一 个 参数 ,即使 用 命令 


2Z= null (A, 'r') 


这 里 的 参数 "表示 返回 的 是 用 有 理 数 (rational number) 表 示 的 基 , 这 样 返回 的 矩阵 Z 
就 是 矩阵 (ai ,oz ,as ). 其 实现 原理 是 先 求 出 矩阵 4 的 行 最 简 形 Ua, 再 通过 适当 取 值 , 构 
造 出 矩阵 乙 具体 可 参考 ATLAST 程序 包 ( 见 本 书 配套 程序 ) 中 的 函数 nulbasis, 这 个 程 
序 包 是 NSF (National Science Foundation, 美国 国家 科学 基金 会 ) 资 助 的 ATLAST 
(Augment the Teaching of Linear Algebra though the use of Software Tools ,用 软件 工 
有 具 增 强 线性 代数 的 教学 ) 项 目的 重要 成 果 . 


2.1.2 向 量 空间 


现在 用 “文明 人 ”的 眼光 来 考察 集合 S. 让 我 们 且 行 且 思 , 慢 慢 “享受 "这 抽象 的 过 程 . 首 
先 ,我 们 把 目光 聚焦 在 S 的 元 素 所 具有 的 一 般 性 质 上 ,因为 具有 这 种 性 质 的 集合 大 量 存 在 . 

定义 2.1.1 如 果 V 是 n 维 列 向 量 的 非 空 集合 ,并 且 V 对 于 加 法 及 数 乘 这 两 种 向 量 
运算 都 封闭 ,那么 就 称 集合 V 为 向 量 空间 (vector space). 

按 此 定义 ,集合 S 就 是 一 个 向 量 空间 . 特别 地 , 仅 有 一 个 零 向 量 的 集合 {0 | 0 = 
(0,0,…,0)"} 也 是 向 量 空间 ,我 们 称 之 为 零 空 间 (zero space, 注意 不 要 与 矩阵 的 零 空 间 
混淆 ). 

例 2.1.2 全 体 3 维 向 量 的 集合 显然 是 一 个 向 量 空间 , 记 为 R:. 一 般 地 ,全 体 n 维 
向 量 的 集合 RR" 是 一 个 向 量 空间 . 
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例 2.1.3 和 集合 T= {x|x== (zi,zxs,0)7,Xi,xz € 民 ) 是 一 个 向 量 空间 . 因为 对 任 


x 二 y= (xisz20) TT (yyy20) = (rty ,xy 0) ET 
kx = (kz ,kz2 ,0)TET 


例 2.1.4 集合 Q== {x|x 二 = (zi;,zz,1)7 ,Xxi,Xxz € 民 ) 不 是 一 个 向 量 空间 . 这 是 因 
为 加 法 和 数 乘 都 不 封闭 ,例如 2x 二 x 十 x 二 (2Xi,27x2,2)" FQ. 

从 几何 上 看 , Q、 了 都 是 平面 ,而 且 Q V T, 但 前 者 不 是 向 量 空间 ,后 者 却 是 向 量 空 
间 . 这 是 因为 工 过 原点 ,而 Q 不 过 原点 . 一般 地 , R" 中 不 过 原点 的 平面 都 不 是 向 量 空间 . 

接着 来 考察 S 中 元 素 @1 ,oz ,os 与 S 的 关系 . 

例 2.1.5 向 量 组 @ ,es,…,a, € R" 的 所 有 线性 组 合 的 集合 


{x|x=ki@1 二 kz@2 二 "Tks ,Ri,ks ,Rk ER} 


是 向 量 空 回 | , 记 为 span(@i ,02 ，… ,0 ). 


我 们 称 span(oi ,oz ，……,a:,) 是 由 问 量 ol ,as ，…… os 所 张 成 (span) 的 向 量 空间 ,并 称 
ol ,2, 为 此 空间 的 生成 元 (set of generators). 注意 ,生成 元 是 无 序 的 , 即 


span(@i ,0z ,03 ) 一 Span(CCl ,03 ,02 ) = span(@s ,Cl 0 ) 一 … 一 Span(oas ,0 ,CI ) 


并 且 向 量 组 wi ,wz ,as 未 必 一 定 是 线性 无 关 的 . 

显然 ,在 例 2. 1.1 中 , S 二 span(ol,oz,os) CR , 即 S 是 R” 的 子 空间 .一 般 地 ,我 
们 定义 子 空间 的 概念 如 下 : 

定义 2.1.2 设 有 向 量 空间 Vi 及 V2. 如 果 Vi 忆 Vi, 则 称 Vi 是 Vs 的 子 空间 (sub- 
space). 

显然 , 例 2.1.3 中 的 工 是 R’ 中 的 任意 向 量 X 一 (CZ1yZ2 7 在 OQrizs 平面 上 的 投 
影 向 量 所 构成 的 向 量 空间 ,我 们 称 之 为 投影 子 空间 (projective subspace). 另外 ,向 量 空 
间 V 是 它 自 己 的 子 空间 ,而 零 空 间 则 是 所 有 向 量 空间 的 子 空间 . 

例 2.1.6 RR: 不 是 Ri 的 子 空间 , Ri 二 {z= (ziyzxz),0)7|zi,xs RR} 才 是 Ri 
的 子 空间 . 

回 看 S 的 生成 元 Qi ,az ,as. 易 知 ol ,az ,os 线性 无 关 , 即 向 量 组 w ,az ,os 的 秩 为 3， 
也 即 


ki@i + k20; + ka@s 0 人 Oh Rk» ks 0 


不 过 ,作为 S 的 生成 元 ,此 向 量 组 是 否 唯一 呢 ?” 生 成 元 的 个 数 应 该 是 多 少 呢 ? 

定义 2.1.3 ”如果 向 量 空间 V 中 存在 一 组 向 量 wi ,wz ,…,w 和 任意 向 量 @, 满足 : 

(1) oo 0, 线性 无 关 , 即 向 量 组 ol ,wz ,…,@, 的 秩 为 x; 

(2) @ 都 能 由 xi,oz，…a: 唯一 地 线性 表示 , 即 存在 唯一 的 一 组 数 mi ,zz，…zr， 
使 得 


@ 一 ZiCI 十 2202 十 … 十 GZ， (2 L, 1Y 
则 称 oa ,oz ，…,@ 为 V 的 一 组 基 (base), 称 @; 为 第 i 个 其 向 量 (base vector)(i 二 1,2,…， 
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六 ), 称 三 (mr)I 为 向 量 w 在 这 组 基 下 的 坐标 向 量 (coordinate vector) ,其 中 的 
Zz; 被 称 为 向 量 @ 在 这 组 基 下 的 第 ; 个 坐标 (coordinate). 另外 , 称 这 组 基 中 的 向 量 个 数 x 
为 向 量 空间 V 的 维 数 (dimension), 记 为 dmV 一 二 

按 此 定义 , 例 2.1.1 中 的 向 量 组 wo ,az ,as 就 是 解 空 间 S 的 一 组 基 , 即 S 的 维 数 为 
dims 一 3. 

几 点 说 明 : 

(1) 若 令 A = 二 (qi ;ts,…,0@,), 则 式 (2.1.1) 可 以 写成 Ax = a, 这 样 求 向 量 e 在 基 
ci，… or 下 的 坐标 xz ,xo，… ,zx,， 就 转化 为 求 线性 方程 组 Ax 二 w 的 解 问 量 x. 显然 ， 
此 方程 组 有 唯一 解 . 

(2) 向 量 @ 的 坐标 向 量 z 既是 @ 的 唯一 标识 ,也 反映 了 @ 的 构成 方式 , 即 以 zx; 为 权重 
取 相 应 的 基 向 量 w 组 合 而 成 . 

(3) 千 把 向 量 空间 V 看 做 无 穷 个 向 量 组 成 的 向 量 组 ,那么 V 的 基 就 是 该 向 量 组 的 极 
大 无 关 组 ,V 的 维 数 就 是 该 向 量 组 的 秩 . 

(4) 注 意 一 组 基 中 的 基 向 量 是 无 序 的 ,但 向 量 在 给 定 的 一 组 基 下 的 坐标 向 量 x 却 是 
有 序 的 . 

(5) 若 向 量 组 wl ,wz ,…,@, 是 向 量 空间 V 的 一 组 基 , 则 V = span(@i,@;,…,Q,). 

(6) 个 数 与 向 量 空间 V 的 维 数 相等 的 线性 无 关 组 都 是 V 的 基 , 因 此 基 不 是 唯一 的 . 

(7) 基 向 量 个 数 为 有 限 数 的 向 量 空 间 称 为 有 限 维 向 量 空间 ,否则 称 为 无 限 维 向 量 
空间 . 

(8) 对 Ri 而 言 ,其 0 维 子 空间 是 零 空 间 (010 = (0,0,0)T) , 其 1 维 子 空 间 是 经 过 原 
点 的 任意 直线 ,其 2 维 子 空间 是 经 过 原点 的 任意 平面 ,其 3 维 子 空间 是 它 自 身 . 

(9) 复 数 域 C 是 2 维 向 量 空间 ,因为 任意 复数 二 a 十 bi 可 写成 z= 二 a，1 十 bi, 其 
中 i = 二 v 一 1, 即 z 在 基 1, i 下 的 坐标 向 量 为 (a,6)T. 


1 3 = 0 
例 2.1.7 已 知 向 量 组 w = 2 |,@ = |1|,as = 1 | 和 二 5 |,p = 
S| 0 2 一 总 
一 3 一 
— | Bb; 一 3 ， 证 明 CI 0C2 ，C3 是 民 ” 的 基 ,并 求 hb ,应 ,Pp: 在 此 基 下 的 坐标 . 
6 2 


分 析 : 帮 Ql :02 ,03 是 R’ 的 基 , 则 Ql1 :02 03 线性 无 关 , 即 矩阵 人 一 (a 02 ,03 ) 可 逆 ， 
至 于 求 Ph ,Pp Pp; 在 CI ,02 ,0 下 的 坐标 ,也 就 是 寻找 一 组 数 Ty (1,7 > ly Ys 使 得 


羽 三 ZuvCl 十 Zoig2 十 Zigs (= 1,2,3) 
写成 矩阵 形式 ,就 是 
X11 X12 T13 
(BisBs ,Bi3) = (sm os) ra x rs | (G00) 
3 JX32 X33 


即 求 Bb ,Pp Pb; 在 Ql 02 ,03 下 的 表示 矩阵 XX 者 记 B= (ph :Pp; ,pb;)， 则 问题 又 转化 为 求 矩 
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阵 方程 AX 二 B 的 解 X = 二 A71B. 
解 : 令 A 二 (qi ,60,03),B 二 (所, 民 ,B;). 因为 14| 关 0, 所 以 A 可 道 ,因此 @,@,@s 
线性 无 关 . 又 由 于 ol ,os ,os 中 向 量 的 个 数 等 于 向 量 的 维 数 , 所 以 它 是 R’ 的 一 组 基 . 
因为 A 可 道 ,因此 AX = B 有 了 唯一 解 . 


i 饼 多 要 “一 移交 1 光 虽 3 一 6 '2 1 Qi: 8 一 和 0 
_ - ~ A 
0 0 4 0 0 4 QO 1 0 0 1 0 0 1: 泊 加- 1 
3 一 6 0 
即 (BispB: ,Bs) 一 (ol os) | 一] 2|= (ol ,2 ,03)X 
0 0 1 
所 以 Pi=3°* ot 1)* gO0* 


P=(—6)* otl* 0+ 
B=0°* oat2°* al1* os 
即 房 , 户 , 记 在 wo'os 下 的 坐标 向 量 分 别 为 (3, 一 1,0)7，( 一 6,1,0)7 和 
CO Ly, 
显然 ， IB| 了 0, 所 以 PB ,六 ,5 也 线性 无 关 ， 因此 所 ,Pp ,Ps 也 是 R 的 一 组 基 ,而 且 易 


一 上 一 入 412 
知 CI 0C2 ,03 在 Bb ,及 ,Pp; 下 的 表示 和 矩阵 为 Y XX" 5 3 6 |， 
0 0 3 


定义 2.1.4 设 ooc ,oo 和 采 , 户 …, 有 是” 维 向 量 空间 YV 的 两 组 基 , 有 上 且 存 在 可 
首 和 矩阵 P, 使 得 
(Bi,Bs ,Bb,) = (ai,0 ,0 P C2, 了 光 ) 


则 称 式 (2. 1. 2) 为 基 变 换 公式 (base transformation formula), 称 和 矩阵 了 为 基 @i ,ay ，,…， 
2 到 基 ,PB,,….,p, 的 过 渡 矩 阵 (transition matrix), 且 有 


P= (ol ,02 0, ) (gi ,Pa ,**… ,Bp,) (2. J 


由 此 定义 可 知 ,在 维 向 量 空间 V 中 ,任意 个 线性 无 关 的 向 量 都 可 以 作为 V 的 一 
组 基 . 显然 ,对 于 不 同 的 基 , 同 一 个 向 量 的 坐标 是 不 同 的 . 比如 在 例 2.1.7 中 ,在 记 ,PB， 
局 下 的 坐标 向 量 为 (1,0,0), 与 它 在 w ,oz ,as 下 的 坐标 向 量 (3, 一 1,0)7 明显 不 同 . 

那么 , 随 着 基 的 改变 ,同一 个 向 量 的 坐标 如 何 改变 呢 ? 

事实 上 , 若 有 aw = (oo00)x 及 w 一 ( 记 ,…, 甩 )7， 由 矩阵 (ol ,ao,) 可 逆 及 式 
(2. 1. 2) 可 知 


第 2 章 线性 空间 与 线性 变换 。 45。 


pe (@i so 0 ) 0 -= (Qi ,0 ) (ph ,°° ,By Ne Py 


定理 2 1. 1 设 7 维 向 量 空 间 V 中 元 素 w 在 基 wi 702 ， ,On 与 基 记 ,Pp: 这 ,Pb, 下 的 坐 
标 向 量 分 别 为 X 一 (ZlyZ2 We 和 a (@ 3232 yg 卫 为 基 wi 3 02， 0 到 基 记 ， 
及 ,…: 有 ,的 过 渡 和 矩阵 , 则 成 立 坐标 变换 公式 (coordinate transformation formula) : 


x 二 Py 或 者 y= 二 Px (2. 1. 4) 


回 到 齐 次 线性 方程 组 A,ywx 二 0, 显然 ,有 如 下 解 的 结构 定理 : 

定理 2.1.2 设 总 ,2 oo 为 Arox 一 0 的 解 向 量 (简称 解 ) , 则 E = CO 二 GEé ee 
CE, 也 是 hwox 二 0 的 解 . 

这 说 明 ,系数 矩阵 为 m Xn 阶 矩 阵 A 的 线性 方程 组 Ax 二 0 的 解 集 


N(A)= {x€ R" |Ax= 0} 


也 是 向 量 空间 , 称 为 Ax = 0 的 解 空间 或 矩阵 4 的 零 空间 . 请 注意 , 提 到 解 空 间 时 我 们 针 
对 的 是 方程 组 Ax 二 0, 而 说 到 零 空间 时 针 , 对 的 则 是 矩阵 A. 

定理 2.1.3 齐 次 线性 方程 组 Asxz 三 0 的 解 空间 N(4) 的 维 数 为 dimN(A) 一 ”一 
r(4), 其 中 7 三 r(4) 为 矩阵 4 的 秩 Crank) , 即 算 阵 4 的 行 阶梯 和 矩阵 Ha 或 行 最 简 和 矩阵 Ua 
中 非 零 行 的 个 数 , 也 就 是 矩阵 4 的 列 ( 行 ) 向 量 组 的 极 大 无 关 组 中 的 向 量 个 数 . 

在 例 2. 1. 1 中 , ”一 r(4) 二 5 一 2 二 3, 因此 原 方程 组 的 解 空 间 S 是 3 维 的 ,这 样 我 们 
只 能 选 出 3 个 解 向 量 w ,oz ,ai, 它们 构成 解 空间 的 一 组 基 , 称 为 原 方程 组 的 一 个 基础 解 


系 (fundamental system of solutions). 
2.1.3 向 量 空间 的 历史 :前 传 


向 量 空间 的 历史 屡屡 会 给 我 们 一 种 “知识 考古 学 ”的 韵味 . 不 仅 在 各 种 “话语 ”的 转换 
间 ,常常 出 现 历史 的 “断裂 (rupture)”, 而 且 从 考古 学 的 本 意 看 , 先 人 们 在 屡屡 控 到 向 量 空 
间 这 座 宏 伟 建 筑 的 墙角 之 后 ,历经 艰辛 , 才 最 终 弄 明白 了 登 堂 人 室 的 门 径 所 在 . 

向 量 又 称 矢量 ,英文 为 vector, 是 现代 数学 、 物 理学 中 的 重要 概念 . 为 免 术语 混乱 
之 瞪 ,一般 数学 称 向 量 , 物 理 称 矢量 .“vector” 一 词 , 源 自 拉丁 文 “vehere”, 意 为 携带 、 
搬运 或 运输 ,这 显然 与 物理 学 有 关 . 事实 上 ,最 早期 的 向 量 概念 就 来 自 物理 学 中 的 速 
度 、 力 等 概念 . 速度 和 力 都 是 向 量 , 既 有 大 小 又 有 方向 ,满足 平行 四 边 形 法 则 . 亚 里 士 
多 德 (Aristotle, 公 元 前 384 一 公元 前 322 年 ) 的 书 中 就 提 到 了 速度 的 平行 四 边 形 法 
则 ,牛顿 (Isaac Newton,1643 一 1727) 则 把 力 的 平行 四 边 形 法 则 作为 其 运动 定律 的 
推论 . 

随 着 力学 的 不 断 发 展 ,借助 于 笛 卡 尔 (Rene Descartes,1596 一 1650) 坐 标 系 , 向 量 的 
概念 被 从 质点 力学 扩充 到 其 他 力学 对 象 . 欧 拉 将 刚体 力学 中 用 几何 描述 定义 的 力矩 公 
式 , 即 力矩 是 力 强 度 与 共同 垂直 于 轴 和 力 的 作用 线 的 长 度 之 积 ,坐标 化 为 M= fP 十 eQ 十 
hR, 这 里 P.QR 分 别 是 关于 轴 z yz 的 力矩 , fg 、h 分 别 是 力矩 轴 与 坐标 轴 夹 角 的 余 
弦 . 显然 ,这 类 似 于 下 面 的 定理 : 沿 给 定 直线 的 力 可 以 看 成 它 在 三 个 坐标 轴 上 的 投影 之 
和 . 泊 松 (Simeon-Denis Poisson,1781 一 1840) 则 在 1808 年 的 文章 里 ,将 质点 的 力矩 视 为 
一 个 平面 , 它 关 于 某 固定 轴 的 分 量 就 是 它 在 垂直 于 该 轴 的 平面 上 的 投影 . 他 的 这 种 力矩 
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的 几何 理论 一 时 广为人知 . 之 后 的 比 奈 (Marie Binet,1786 一 1856) 在 1814 年 给 出 了 刚体 
动力 学 中 刚体 平衡 的 一 般 条 件 : 
PDF? 4+2D FFicos(FisF) = 0; 2 Mi +2 MMicos(Mi, Mi) =0 


其 中 , F, 和 M; 分别 表 示 作 用 于 物体 上 的 力 与 力矩 . 这 显然 清楚 地 指出 了 力 与 力矩 的 相似 
性 . 他 还 首次 通过 力矩 的 几何 表示 给 出 了 转动 动量 定律 . 与 此 同时 , 潘 索 (Louis Poinsot 
1777 一 1859) 在 1803 年 出 版 的 《 静 力 学 原理 》(Eléments de statidque ) 中 ,通过 引入 力 偶 的 
概念 ,处 理 了 项 力学 问题 . 他 的 力 偶 是 大 小 相等 .方向 相反 ,但 作用 线 不 在 同一 直线 上 的 
一 对 力 . 这 是 一 个 自由 矢量 ,其 大 小 为 力 的 强度 乘 以 二 力作 用 线 间 的 距离 , 方 回 由 右手 螺 
旋 法 则 确定 ,并 垂直 于 二 力 所 构 成 的 平面 . 他 证 明了 如 果 用 垂直 于 力 偶 的 平面 上 的 线段 
表示 力 偶 ,就 可 以 通过 平行 四 边 形 法 则 复合 两 个 力 偶 . 书 中 最 先 采 用 有 向 线段 的 几何 合 
成 方式 处 理 整个 静 力 学 问题 ,这 使 得 该 书 影响 深远 . 尽管 当时 力学 中 普遍 地 涉及 向 量 ,但 
其 表述 却 团 于 笛 卡 尔 坐 标 之 中 ,没有 出 现 现代 意义 下 的 简洁 的 向 量 形式 . 

我 们 再 来 考察 向 量 空间 理论 的 另 一 个 重要 思想 来 源 一 一 位 置 几 何 (geometry of situ- 
ation). 如 上 所 述 ,解析 几何 在 力学 发 展 中 发 挥 了 重要 作用 . 事实 上 ,解析 几何 直接 促成 了 
数学 研究 对 象 的 彻底 变革 , 微 积 分 的 伟大 成 功 也 拜 其 所 赐 . 这 种 几何 与 代数 的 “ 数 形 结 
合 ” 使 得 线性 方程 组 成 为 最 重要 的 方程 类 型 ,从 而 凸显 了 直线 在 几何 中 的 基础 性 地 位 . 同 
时 ,基于 曲线 的 方程 来 讨论 曲线 的 分 类 ,也 自然 引出 了 对 所 采用 的 坐标 变换 (当时 称 为 线 
性 替换 ) 的 各 种 效果 的 分 析 . 再 者 ,解析 几何 也 具有 突破 三 维 的 可 能 性 (虽然 直到 两 个 世 
纪 后 这 种 可 能 性 才 变 为 现实 ). 尽管 如 此 ,有 些 数学 家 仍 对 之 进行 了 批评 . 主要 的 指责 是 
几何 问题 的 求解 变 成 了 纯粹 的 数字 计算 ,完全 与 传统 的 欧 几 里 得 (Euclid, 约 公元 前 330 
年 一 前 275 年 ) 几 何 无 关 了 . 这 仿佛 宾客 在 宴席 上 大 快 杂 颐 ,然后 告诉 一 边 果 望 着 的 主 
大: 这 是 :ee 于 是 :woos 味道 好 极 了 !” 还 有 ,在 使 用 解析 几何 方法 求解 几何 问题 时 ,坐标 
系统 的 选取 是 很 自由 的 ,但 不 同 坐 标 系统 的 计算 量 却 可 能 存在 湖 壤 之 别 . 在 这 些 批评 中 ， 
莱 布 尼 兹 (Gottfried Wilhelm Leibniz,1646 一 1716) 的 最 有 建设 性 . 在 1679 年 写 给 惠 更 
斯 (Christiaan Huygens,1629 一 1695) 的 信 及 随 信 附 上 的 论文 中 (发 表 于 1833 年 ) ,他 认 
为 , “代数 仅 仅 能 表达 未 定 的 数 或 量 值 ,不 能 直接 表达 位 置 、 角 度 和 运动 ”, 因 此 “ 它 ( 代 
数 ) 没 有 给 出 最 简洁 的 方法 或 者 几何 上 最 优美 的 结构 ” 他 进而 提出 了 男 一 种 分 析 ， 
“这 种 分 析 明 显 地 是 几何 的 或 者 是 线性 的 ,并 且 能 像 代数 表达 量 值 一 样 直接 表达 位 置 
(situation). ”通过 这 种 分 析 可 以 “用 字符 来 表达 图 形 和 运动 ,就 像 通 过 代数 来 表达 数 和 
量 一 样 ”. 这 种 分 析 的 价值 在 于 “不 需要 大 量 的 乘法 ,也 不 需要 添加 令 人 困惑 的 太 多 的 
点 和 线 ”, 而 且 “ 通 过 这 种 方法 ,人 们 可 以 像 处 理 几 何 一 样 处 理 力学 ”. 不 过 莱 布 尼 兹 所 
描述 的 系统 绝 不 意味 着 他 发 现 了 哪怕 最 原始 的 向 量 分 析 , 尽 管 他 正在 寻找 与 之 类 似 的 
东西 . 

在 莱 布 尼 效 的 信 及 论文 首次 发 表 后 不 久 , 为 了 鼓励 大 家 进一步 发 展 他 的 系统 ,有 人 
专门 设立 了 一 项 奖金 ,获奖 者 是 格拉 斯 曼 (Hermann Giinter Grassmann,1809 一 1877, 见 
图 2- 1), 尽 管 他 在 此 之 前 已 经 创造 了 自己 的 系统 .在 1847 年 写 给 圣 维 南 (Adhémar Jean 
Claude Barré de Saint-Venant,1797 一 1886) 的 信 中 ,他 写 道 :“ 我 在 那 一 年 (1832 年 ) 构 思 
了 两 条 或 更 多 条 线 的 几何 的 和 与 差 ,还 有 两 条 或 三 条 线 的 几何 积 的 第 一 个 思想 . ”后 来 在 
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1844 年 出 版 的 《线性 扩张 论 》CDie Lineale Ausdehnungslehre, 见 图 2-2) 中 ,他 详细 地 阁 
明了 其 思想 来 源 : 四 对 几何 中 负数 的 考虑 ,如 把 距离 AB 和 BA 看 成 是 相反 的 量 ,这 样 无 
论 A.B.C 三 点 是 否 共 线 ,都 有 AB 十 BC 二 AC;@ 从 父亲 那里 获得 的 几何 积 的 思想 ,例如 
将 长 方形 及 平行 四 边 形 看 成 相 邻 两 边 的 乘积 ,这 里 既 要 考虑 两 边 的 长 度 ,也 要 考虑 其 方 
向 . 这 样 两 向 量 的 和 乘 以 与 它们 共 面 的 向 量 时 ,结果 与 用 此 共 面 向 量 分 别 乘 以 原来 的 两 
向 量 , 再 把 积 相 加 的 结果 相同 . 


eale | 
Ausdehnungslehre 
Ein Neuer Zweig Der 
Mathematik (1844) . 


2-1 格拉 斯 曼 (1809 一 1877) 图 2-2 德 文 版 (线性 扩张 论 》 
格拉 斯 曼 申 请 了 科学 考试 委员 会 主持 的 考试 ,并 在 1840 年 提交 了 论文 “潮汐 理论 
(Theorie der Ebbe und Flut)”. 在 文中 ,他 将 自己 已 使 用 过 的 几何 分 析 (geometrical analysis) 
方法 ,运用 到 对 潮汐 的 研究 中 . 在 用 方程 号 二 const (这 里 二 表示 两 边 几 何 上 相等 , 即 速 
度 在 数值 和 方向 上 保持 不 变 ) 表 示 惯 性 定律 之 后 ,他 证 明了 “几何 加 减法 ”的 交换 律 和 结 
合 律 . 他 是 最 先 那 批 意识 到 这 些 运算 律 以 及 乘法 分 配 律 的 全 部 意义 的 学 者 之 一 . 然后 他 
讨论 了 向 量 微 积分 学 ,将 惯性 定律 重 述 为 Cy 二 0, 并 指出 这 个 方程 表示 三 个 常 微分 方 


dd 一 
程 . 他 还 证 明了 共 面 的 三 个 向 量 的 积 为 0、 左 右 分 配 律 以 及 向 量 的 几何 积 的 反 交 换 律 ,并 
将 几何 积 表达 为 " 线 的 长 度 的 积 乘 以 它们 之 间 夹 角 的 正弦 ( 带 符号 )”. 这 些 结果 显然 与 向 


量 的 又 积 很 类 似 , 主 要 的 区 别 是 几何 积 的 结果 不 是 向 量 ,而 是 有 向 面积 . 尽管 这 些 几何 概 
念 以 一 种 普遍 和 简单 的 方式 确定 了 力学 概念 ,但 他 纯粹 是 从 几何 的 基础 上 得 到 它们 的 . 
格拉 斯 曼 的 系统 不 仅 是 第 一 个 重要 的 向 量 分 析 系统 , 而 且 是 正在 喷 薄 而 出 的 新 代数 中 的 
主要 工作 . 这 种 新 代数 的 革命 性 本 质 堪 与 非 欧 几 何 相 媲美 . 遗憾 的 是 这 份 200 多 页 的 论 
文 , 拥 有 绝对 话语 权 的 审 稿 人 只 看 了 5 天 ! 我 们 就 这 样 与 新 代数 氛 肩 而 过 . 因为 等 到 此 
文正 式 发 表 的 1911 年 ,黄花 菜 早 凉 了 . 

可 是 格拉 斯 曼 已 经 走 得 更 远 . 4 年 后 ,在 《线性 扩张 论 ) 的 前 言 中 ,他 写 道 :“( 本 书 中 
的 ) 这 种 分 析 并 没有 涉及 以 前 我 在 几何 中 发 现 的 那 种 分 析 …… 几 何 只 不 过 是 其 中 的 一 个 
特殊 应 用 . “几何 与 自然 中 的 某 个 事物 即 空间 有 关 …… 一 定 存在 数学 的 一 个 新 的 分 支 ， 
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它 以 一 种 类 似 于 几何 的 纯 抽 象 的 方式 产生 , 而且 难免 会 涉及 空间 . ”他 明确 地 指出 ,这 种 
分 析 的 内 容 “ 除 去 了 三 维 空间 的 限制 ”. 接 下 来 ,他 给 出 了 自己 的 哲学 思想 . 他 认为 :“ 纯 数 
学 是 一 门 关 于 通过 思考 产生 的 特别 存在 的 科学 . 在 这 种 意义 下 的 特别 存在 ,我 们 称 之 为 
思想 形式 ,或 简称 为 形式 (form). 纯 数学 就 是 关于 形式 的 理论 . ”格拉 斯 曼 相信 他 已 经 发 
现 了 这 样 一 种 纯粹 的 形式 系统 , 它 高 于 几何 ,并 且 独 立 于 几何 以 及 当时 已 知 的 所 有 数学 . 
这 种 系统 是 一 种 泛 代数 (universal algebra) ,其 中 的 形式 不 必 具 备 实际 内 容 , 但 需要 时 可 
赋予 其 几何 内 容 , 比 如 数 、 点 、 向 量 、 有 向 面积 等 . 显然 ,他 的 形式 理论 具有 令 人 吃惊 的 普 
遍 性 和 抽象 性 . 他 接着 明确 提出 了 四 个 概念 :离散 与 连续 、 相 等 和 不 等 ,并 用 它们 来 形成 
所 有 数学 ,例如 算术 是 离散 且 相 等 的 .函数 理论 是 连续 且 相 等 的 . 连续 且 不 等 的 ,就 是 他 
的 线性 扩张 论 ,比如 空间 的 维 数 就 是 “不 等 ?的 ,而 其 中 的 元 素 ( 例 如 点 ) 的 “连续 ?变化 可 
产生 不 同 的 实体 (例如 线 ). 以 空间 理论 为 例 , 格 拉 斯 曼 进而 指出 , 当 生 成 元 素 从 两 个 不 同 
方向 以 任意 方式 增长 时 ,可 产生 平面 上 的 所 有 元 素 . 按 这 种 方式 产生 的 所 有 点 构成 一 个 
新 元 素 , 即 该 平面 . 它 是 一 个 二 阶 系统 ,是 依赖 于 两 个 原始 方向 的 无 穷 多 个 方向 的 集合 . 
如 果 再 加 上 第 三 个 无 关 方向 ,就 产生 了 三 阶 的 无 限 空间 . 然而 ,在 线性 扩张 论 中 ,方向 的 
数目 可 以 增加 到 无 穷 . 

接 下 来 ,格拉 斯 曼 开始 利用 他 的 哲学 思想 构造 形式 系统 . 他 首先 定义 了 两 个 形式 a 
与 4 之 间 的 一 种 联系 (我 们 称 之 为 “加 法 ”, 并 采用 现代 的 记号 ,后 同 ) ,得 到 新 形式 a 十， 
它 满足 方程 : 


& 十 8 三 8 十 ae 十 0 十 ec 一 & 十 (2 十 c) 三 a 二 +b 十 6 


然后 ,他 定义 了 的 a 与 5 的 “减法 ”, 得 到 的 a 一 6 满足 (a 一 5) 十 b 三 a, 而 且 成 立 下 面 
的 方程 : 


人 一 由 一 和 三 & 一 6 一 & 研 有 一 人 十 人) 有 一 (人 一 梧 三 & 一 如 十 6 


他 进一步 给 出 了 “ 零 ” 形 式 ( 记 为 0 ) ,满足 0 = 二 a 一 a, 以 及 0 与 5 的 “减法 ”, 即 65 的 
“ 负 ” 形 式 一 b. 他 还 定义 了 形式 a 与 6 的 “乘法 ”a X65b, 满足 (a 十 b) Xec==aXc+t+bXe,， 
以 及 除法 . 

到 目前 为 止 ,我 们 还 只 是 管 寅 了 一 下 格拉 斯 曼 的 思想 . 事实 上 ,他 在 书 中 还 给 出 了 向 
量 的 外 积 、 内 积 、 夹 角 \ 长 度 、 框 积 等 概念 ,涉及 nn 维 向 量 空间 、 子 空间 、 张 成 集 、 线 性 无 关 、 
基 、 维 数 等 概念 . 过 于 哲学 的 前 言 ( 光 这 就 让 一 批 数学 家 踊 踊 不 前 ) ,许多 刻意 挑选 的 术语 
( 连 许多 德国 数学 家 都 闻所未闻 ) ,以 及 当时 大 多 数 数学 家 难以 理解 的 内 容 , 使 得 这 本 书 
星 涩 难 懂 , 少 人 间 津 . 尽管 惊 呼 “格拉 斯 曼 是 个 伟大 的 天 才 ” 的 哈密 顿 (Sir William Rowan 
Hamilton,1805 一 1865) 自 己 也 是 伟大 的 天 才 (13 岁 时 就 通晓 13 种 语言 ) ,但 连 他 也 说 ,为 
了 要 阅读 格拉 斯 曼 ,或 许 他 必须 学 会 抽烟 . 虽然 1862 年 格拉 斯 曼 出 版 了 修订 版 ,其 中 大 
量 压 缩 了 哲学 性 的 叙述 ,但 仍然 没 能 使 得 自己 的 思想 更 好 地 被 人 了 解 ， 

“其 曲 弥 高 ,其 和 弥 寡 . > 天才 的 思想 往往 都 是 超越 时 代 的 ,格拉 斯 曼 也 没 能 幸免 . 直 
到 1920 年 左右 ,E. 嘉 当 (Elie Joseph Cartan,1869 一 1951) 才 在 创设 外 代数 (也 称 格拉 斯 
曼 代数 ) 和 微分 几何 的 基础 时 ,引入 了 基础 性 的 格拉 斯 曼 流 形 .“ 墙 里 开花 墙 外 香 ”, 墙 里 
的 向 量 理论 没 能 毛毛 到 花香 .自然 就 会 误 入 歧途 . 与 此 同时 ,关于 复数 的 研究 工作 却 阴 差 
阳 错 地 促成 了 向 量 空间 理论 的 发 展 . 正 所 谓 “ 种 瓜 得 豆 ”. 
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尽管 德 摩根 (Augustus De Morgan,1806 一 1871) 在 答复 哈密 顿 的 信 中 ,认为 复数 的 
历史 要 追溯 到 印度 人 ,但 目前 大 家 公认 的 是 ,卡尔 达 诺 (Girolamo Cardano,1501 一 1576) 
在 其 1545 年 出 版 的 (大 术 》(Ars Magna) 中 ,就 遭遇 方程 的 复 根 ,并 形式 上 处 理 过 复数 运 
算 . 之 后 许多 数学 家 一 直 苦 苦 寻 求 复 数 的 几何 意义 ,以 赋予 复数 合法 地 位 . 沃 利 斯 (John 
Wallis,1616 一 1703) 通 过 几何 作 图 , 曾 洞 察 到 虚数 的 意义 在 于 垂直 方向 . 最 终 拨 开 迷雾 的 
是 韦 塞 尔 (Caspar Wessel,1745 一 1818)、 阿 尔 风 (Jean Robert Argand,1768 一 1822) 和 高 
斯 等 人 . 

作为 丹麦 皇家 科学 院 的 一 名 测绘 员 , 韦 塞 尔 于 1797 年 提交 了 论文 “ 论 方向 的 解析 表 
示 ”, 并 于 两 年 后 发 表 在 科学 院 的 院 刊 上 . 在 文中 ,他 一 开始 就 开宗明义 : “怎样 解析 地 表 
示 方 向 ?” 接 着 ,他 通过 平行 四 边 形 法 则 ,定义 了 有 向 线段 的 加 法 . 他 举例 说 明 对 一 个 顶点 
为 abcyd 的 四 边 形 , 有 ab 十 Kt 十 cd 十 da = 0. 他 真正 的 革新 在 于 接着 给 出 的 有 向 线段 
乘积 的 几何 定义 . 首先 ,两 因子 与 正 单位 ( 即 a， 1 十 bv 一 1 中 的 1 ) 共 面 (也 与 积 共 面 ) ;其 
次 , 积 的 长 度 等 于 两 因子 的 长 度 之 积 ;最 重要 的 , 积 的 方向 角 ( 正 单位 的 方向 角 为 0” ) 等 于 
两 因子 的 方向 角 之 和 . 接 下 来 ,他 写 道 :“ 设 十 1 表示 正 的 直线 单位 , 十 es 表示 另 一 种 单位 ， 
它 与 正 单 位 有 共同 起 点 且 垂直 于 正 单位 ,那么 十 1 的 方向 角 为 0 ,一 1 的 方向 角 为 180 ， 
十 的 方向 角 为 90", 一 e 的 方向 角 为 一 90 或 270%. 根据 规则 , 积 的 方向 角 等 于 因子 方向 
角 之 和 ;我 们 有 (十 1) (TD = 二 1, (1TD)( 一 1 = 一 1,; (一 1) (一 1) = 十 1; (十 1)(+e) = 
+e; (+ 1)(—e) =—ée; (—1)(He) =—e; (—1)(—e) =+te, (He)(—e) =+1, (—e) 


(一 se) = 一 1. 由 此 显然 可 知 e 就 是 v 一 1. ”接着 他 指出 ,平面 上 的 任意 有 向 线段 都 可 以 
解析 地 写成 w 十 电 和 xr(cosv 十 esinv)，, 并 证 明了 这 种 表达 式 如 何 相 乘 、 相 除 及 求 寡 . 按 他 
的 解释 , el(a 十 钙 ) 一 一 0 十, 即 有 向 线段 < 十 被 道 时 针 旋 转 为 一 ea , 因此 s 即 v 一 工 
还 是 一 个 旋转 算 子 . 正如 有 个 笑话 所 说 :“ 和 您 拨打 的 电话 号 码 是 虚 号 (虚数 ) ,如 果 您 想 拨 
到 实 号 (实数 ) ,请 把 您 的 电话 旋转 90, 再 试 一 下 . ”也 就 是 说 ,“ 利 用 旋转 的 解释 什么 也 
没有 证 明 ”. 我 们 将 在 2. 4. 3 小 节 再 对 此 予以 详细 解释 . 

虽然 韦 塞 尔 还 把 他 的 思想 进一步 地 拓展 到 三 维 空间 ,但 历史 再 次 显露 出 它 残 酷 无 情 
的 本 色 . 韦 塞 尔 用 丹麦 文 写 的 论文 读者 寥寥 无 几 . 直到 百年 后 的 1895 年 ,该 文才 被 重新 
发 现 , 并 译 成 法 文 重新 发 表 . 实际 上 ,最 终 让 大 家 接受 复数 的 是 伟大 的 高 斯 . 在 1831 年 的 
一 篇 论文 中 ,高 斯 以 他 特有 的 简洁 ,给 出 了 复数 汉 十 mz〈( m,n 为 整数 或 零 ) 的 一 种 平面 表 
示 , 并 阐述 了 复数 的 几何 加 法 与 乘法 . 只 是 在 注释 中 ,他 指出 ,这 种 思想 早 就 隐 含 在 他 
1799 年 做 出 的 代数 基本 定理 的 证 明 中 . 

复数 的 几何 表示 仅 限 于 平面 向 量 , 人 们 自然 希望 能 有 一 个 三 维 类 似 物 ,可 以 用 来 处 
理 空间 向 量 . 第 一 个 发 现 这 种 “ 超 复数 ”的 是 哈密 顿 ，1835 年 ,哈密 顿 发 表 了 “代数 作为 纯 
时 间 的 科学 ”一文 ,将 他 早 在 1827 年 就 认定 的 “代数 就 是 时 间 的 科学 ”的 思想 明晰 化 . 他 
认为 ,既然 几何 是 空间 的 科学 ,那么 代数 就 是 时 间 的 科学 ,时 间 的 基本 思想 是 那些 有 居 
先 、 后 来 和 同时 三 种 关系 的 次 序 和 序列 . 在 该 文 的 第 三 部 分 ( 写 于 1833 年 ) ,他 建立 了 有 
序 实数 偶 (a,5), 定义 了 数 偶 的 运算 ,并 证 明了 (a,p0) 等 价 于 复数 a 十 .他 写 道 :“ 在 单 
个 数 的 系统 中 ,符号 V=T 是 芋 唐 的 ,表示 的 是 “不 可 能 的 数 ', 或 者 仅仅 是 一 个 “虚数 ”， 
但 是 在 数 偶 理 论 中 ,同样 的 符号 v 一 1 是 有 意义 的 ,代表 了 一 种 可 能 的 抽象 ,或 者 一 个 数 
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偶 , 即 数 偶 (一 1,0) 的 主 平方 根 (0,1)…… 对 无 论 
怎样 的 任意 数 偶 (al ,az )， 都 有 (aiyaz) 一 Qi 十 as 
v 一 1.“” 他 在 文 末 指 出 ,只 要 将 代数 看 成 纯粹 时 间 
的 科学 ,那么 那些 通常 被 认为 仅仅 是 符号 的 、 难 以 
解释 的 表达 式 ,就 逐渐 变 成 思想 ,并 获得 现实 和 意 
义 . 他 还 希望 今后 能 以 这 种 观点 发 展 一 种 三 元 组 
理论 . 经 过 “ 八 年 抗战 ,他 于 1843 年 发 明了 四 元 
数 ,并 刻 在 了 过 洛 输 桥 (Brougham Bridge, 见 图 图 2-3 四 元 数 圣地 勃 洛 翰 桥 
= 上. 

哈密 顿 认 为 ,他 的 新 数 a 十 名 十 a 必须 满足 下 列 六 条 性 质 ( 这 些 性 质 复数 都 具备 ): 

G) 加 法 和 乘法 的 结合 律 ; 

(2) 加 法 和 乘法 的 交换 律 ; 

(3) 分 配 律 ; 

(4) 除 法 ; 

(5) 模 律 , 即 两 个 新 数 乘积 的 模 等 于 它们 模 的 乘积 ,这 里 a 十 太 十 g 的 模 为 必 十 成 十 人 ; 

(6) 在 三 维 空间 里 要 有 一 个 有 意义 的 解释 . 

考虑 

(Catoitdo) = (a mB oc) 2a)it (2ac)j (GO Be) ji (2.1.5) 


其 中 ,利用 了 天 一 产 王 一 ] 显然 式 (2. 1. 5) 的 右边 也 必须 是 一 个 新 数 , 因 此 可 令 地 = 二 0， 
或 者 令 六 二 一 .对 于 模 律 的 成 立 也 有 类 似 的 要 求 . 再 考虑 两 个 不 同 的 新 数 的 乘积 ,车 仍 
设 术 二 一 万 , 则 有 


(athtog) (十 天 十 区 一 ar—y—e) trtarit(rta)i t+ (Ce — ey)y 


(2, |: 6) 
显然 , 没 能 去 掉 乘 积 中 的 六 项 . 车 令 j= 二 0, 虽然 能 够 实现 这 个 目的 ,但 注意 到 乘积 
的 模 为 
(人 十 多 十 之 十 办 十 轨 ) 二 (一 外 一 人 并 十 ( 寻 十 ay 站 十 (cz 十 oz 并 十 ( 达 一 cy 


2. 1. 7 


其 中 ,乘积 中 六 项 的 系数 和 一 cy 又 以 平方 形式 出 现 ,因此 令 立 = 0 也 行 不 通 . 注意 到 式 
《2. 1.7) 中 模 的 乘积 是 4 个 平方 之 和 ,因此 只 有 令 六 为 未 知 的 &, 将 新 数 扩充 为 包含 4 个 
分 量 ,并且 放弃 乘法 的 交换 律 ,才能 基本 实现 六 个 要 求 . 至 此 ,哈密 顿 的 四 元 数 就 是 形 如 a 
二 名 十 0 十 dk 的 数 ,其 中 心 7 分 别 是 z,y,z 轴 的 单位 向 量 ,并 且 好 一 产 一 已 一 一 1 ( 见 
图 2-4)，, 姜 孝王 友 , 防 馈 二 7 应 王 一 太一) 他 还 指出 ,一 个 四 元 数 < 十 皮 十 避 
十 dk 可 以 看 成 其 标量 (scalar) 部 分 a 与 向 量 (vector) 部 分 太 十 cj 十 dk 之 和 . 显然 ,向 量 部 
分 可 用 空间 中 的 有 向 线段 来 表示 ,问题 是 ,标量 部 分 的 几何 意义 是 什么 呢 ? 两 者 的 加 法 
又 如 何 解释 呢 ? 这 些 问 题 也 让 哈密 顿 十 分 纠结 . 
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尽管 四 元 数 存在 致命 的 缺陷 ,但 它 却 给 代数 学 的 发 展 带 来 了 革命 性 的 影响 . 与 此 同 
时 , 随 着 更 加 革命 性 的 非 欧 几何 和 群 论 思想 的 传播 ,人 们 逐渐 认识 到 :代数 学 的 公理 是 可 
以 改变 的 ,不 仅 交 换 律 ,其 他 运算 规则 ,如 结合 律 等 ,也 可 以 不 满足 ,因此 可 以 自由 地 构造 
各 种 各 样 的 代数 ,进而 使 得 "大 量 看 似 不 同 问题 的 领域 和 结果 之 间 的 联系 第 一 次 被 发 现 
了 ”. 到 了 大 约 1870 年 , n 维 空间 的 概念 已 变 成 了 年 轻 一 代 优 秀 数学 家 的 必 备 知识 . 艾 勃 
寺 (Edwin A. Abbott, 1838 一 1926) 写 于 1884 年 的 政治 讽刺 小 说 《平面 国 》(Flatland， 
2007 年 被 搬 上 银幕 ) ,描述 了 二 维 国 及 其 社会 结构 ,以 及 正方 形 A 的 奇异 经 历 , 书 中 对 维 
数 的 文学 化 描述 ,充分 说 明 当 时 对 空间 维度 的 探索 已 经 广为人知 . 当然 ,更 有 名 的 是 威 尔 
斯 (Herbert George Wells,1866 一 1946) 的 《时 间 机 器 》, 该 书 出 版 的 1895 年 甚至 被 称 为 
“科幻 小 说 诞生 元 年 ” 纵 观 历史 ,我们 不 禁 要 感 概 : 令 人 无 法 自拔 的 ,不 仅 有 牙齿 和 爱情 ， 
还 有 伟大 平凡 而 美丽 的 数学 ， 欲 知 详情 如 何 , 且 待 后 文 分 解 . 


2.2 线性 空间 

Se 。 PE 

线性 空间 是 向 量 空间 在 元 素 和 线性 运算 上 的 推广 和 抽象 , 它 的 元 素 可 以 是 向 量 、 逢 

阵 、 多 项 式 、 函 数 等 , 它 的 线性 运算 既 可 以 是 我 们 熟悉 的 一 般 运算 ,也 可 以 是 各 种 特殊 的 

运算 . 向 量 空间 中 的 线性 组 合 .线性 相关 、 线 性 无 关 、 基 ,坐标 等 定义 和 结论 都 可 以 推广 到 

一 般 线性 空间 ,尤其 是 坐标 ,能 够 将 一 般 线 性 空间 的 问题 转化 成 向 量 空间 的 问题 ,是 一 个 
十 分 有 力 的 工具 . 


2.2.1 什么 是 线性 


什么 是 线性 ”这 是 个 庞大 的 问题 . 我 们 先 通过 线性 函数 来 加 以 说 明 . 

众所周知 ,数学 研究 的 是 现实 世界 中 的 数量 关系 和 空间 形式 (当然 也 有 人 认为 
数学 是 关于 模式 的 科学 ). 两 变量 z,y 之 间 最 简单 的 关系 , 莫 过 于 平移 和 正比 例 关 系 , 即 
yy 三 T 妆 和 yy 二 kr (& 为 正比 例 系数 ) ,复合 在 一 起 ,就 得 到 一 元 线性 函数 y 王 人 妈 十 2(R 尖 0)， 
几何 上 就 是 平面 中 的 一 条 直线 ,这 就 是 它 何以 被 形象 地 称 为 “线性 ”函数 的 缘故 . 特别 地 ， 
当 65 二 0 时 所 得 的 正比 例 隙 数 y 二 kr 又 称 为 一 元 线性 齐 次 函数 ,这 里 的 “ 齐 次 ” 指 的 是 表 
达 式 中 每 项 里 变量 出 现 的 次 数 都 整齐 划一 、 均 为 一 次 . 从 运算 上 看 , y = kx 十 6 涉及 的 运 
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算 仅 为 加 法 和 乘法 ,因此 是 最 简单 、 最 重要 的 函数 . 事实 上 ,高 等 数学 中 的 一 个 核心 思想 
就 是 (局 部 ) 线 性 化 , 即 以 直 代 曲 . 另外 ,线性 函数 也 具有 很 多 有 趣 的 性 质 , 比 如 ,线性 函数 
的 反 函 数 仍 为 线性 函数 ,线性 函数 的 复合 函数 仍 为 线性 函数 ,等 等 . 

在 表达 式 y = kr 十 5 中 ,5 的 作用 并 不 重要 ,因为 它 仅仅 改变 了 起 始点 ,即将 直线 平 
移 了 一 下 .真正 重要 的 参数 是 &, 因为 当 我 们 考察 增 量 Ay 与 Az 的 关系 时 ,由 于 

Ay 王 [LA(Cz 十 Az) 十 0 一 (Az 十 0 一 EAz 

故 Ay 是 Az 的 线性 齐 次 函数 , "不 起 作用 . 这 也 说 明了 高 等 数学 中 导数 何以 如 此 重 
要 ,因为 从 几何 上 看 , 切 点 处 的 导数 了 (zx) 就 是 过 切 点 的 切线 的 斜率 k. 问题 是 ,何以 y = 
kz 中 zz 与 y 会 成 正比 例 变 化 呢 ? 答案 是 线性 齐 次 函数 y = kr 具有 可 加 性 , 

定义 2.2.1 设 函 数 f(z) 的 定义 域 为 D, 若 对 任意 zy E D, 都 有 x 十 y E 也, 以 及 

fry) = fx) f(y) (2. 2 1) 

则 称 函 数 f(x) 具有 可 加 性 ,并 称 式 (2. 2. 1) 为 可 加 性 方程 . 

易 知 一 元 线性 函数 y 二 f(x) = kr 具有 可 加 性 . 而 且 当 自 变 量 扩 大 倍 时 ,由 归纳 假 
设 , 有 

f(r) = firti Ro— Dr]= f+ HR Dr]= fr) Ro DD fr) = k(x) 

即 函 数值 也 扩大 了 同样 的 & 倍 . 

上 述 的 推理 显然 不 严密 ,下 面 我 们 给 出 严格 的 证 明 . 

定理 2.2.1 定义 域内 任意 实数 a,b 都 满足 可 加 性 方程 (2. 2. 1) 的 唯一 连续 函数 
f(x) 是 一 元 齐 次 函数 f(x) = kx ,其 中 二 f(1) 是 任意 常数 . 

证 明 : fC(0) 二 f(0 十 0) = fC(0) 十 (0) = 2f(0), 所 以 f(0) =0, 又 0= f(0) = 
fC 二 1 十 DD 二 fC 一 DD 十 了 (1), 故 了 (一 1) = 一 f/f(1). 对 正 整数 mm, 类 似 可 证 flm) = 
mf 1) f—m) =— mf (1). 


YL ee 、 F 全 二 二 和- 1 | 1 | | . 1 1 
当 并 一 二 (7 为 正 整数 ) 时 ,由 f(1) Pe = A ee 


一 AD， 同样 可 知 /一 ) 一 一 去 10); 浸 一 到 (mn 为 正 整 数 ) 时 ,有 大 各 ) 一 


7 十 二 十 …… 十 二) 一 MAC 二) ,此 即 f(2) = L101). 

当 工 为 无 理 数 时 ,由 实数 系统 的 连续 性 与 完备 性 ,存在 极限 为 x 的 有 理 数列 {xz, )， 
即 有 limz, 二 x. 由 于 已 证 f(x,) 一 xf(1)， 两 边 取 极限 , 即 得 limf(z,) = f(1) limz, 一 
了 (1)x. 注意 到 函数 f(x) 是 连续 函数 ,因此 f(1)zx = lim f(zs) = flim) = fa2), 
k 二 f/f(1), 则 f(x) == kx. 证 毕 . 

综 上 可 知 ,可 加 性 是 连续 函数 成 为 一 元 线性 齐 次 函数 的 充 要 条 件 ,因此 它 是 一 元 线 
性 齐 次 函数 的 特征 性 质 , 显然 ,其 他 函数 就 不 具备 可 加 性 ,比如 f(x) = zx、f(x) = Inz 
和 f(x) 二 sinz 都 是 非 线性 函数 ,因为 (x 十 y)? 关 芭 十 ,ln(z 十 y) 关 Inz 十 ny， 
sin(X 十 y) 关 sinz 十 siny. 

推广 到 个 自 变 量 的 情形 ,我 们 称 f(xiyzsy… ,5) 三 让 了 十 已 如 十 …… 十 有 了 十 有 


心 
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为 区 元 线性 函数 , 当 2 王 0 时 , 称 f(xiyzss*** ,Xn) 二 RX 十 RTz 十 十 th 为 n 元 线 
性 齐 次 函数 . 经 过 类 似 的 分 析 可 知 n 元 线性 齐 次 函数 更 加 重要 ,而 且 它 也 具有 可 加 
性 , 即 

fla yr yr Yi) = fB rn) TT fW ys) (2.2,.2) 


注意 到 元 线性 齐 次 函数 是 n 个 一 元 线性 齐 次 函数 f(zi) 二 xi (i 二 1,2,… ,0) 之 
和 ,因此 ,如 果 只 让 某 个 自 变 量 x; 取得 增 量 Ax; (其 他 自 变 量 保持 不 变 ) , 则 引起 的 因 变 量 
增 量 为 Af = &Ax;, 即 Af 与 Az; 成 正比 例 . 这 也 意味 着 , 若 把 自 变 量 zi ,zo，…,z, 看 做 
影响 函数 值 的 独立 因素 ,那么 每 一 个 独立 因素 作用 的 结果 都 与 它们 的 大 小 成 正比 例 ,而 
且 各 因素 作用 的 总 效果 等 于 每 个 因素 单独 作用 的 效果 之 和 . 事实 上 ,通过 与 前 面 类 似 的 
手法 ,可 以 证 明 守 元 线性 齐 次 函数 具有 如 下 的 齐 次 性 ; 


fkr1 RCR) = kf (Xx ST2 9 XT, ) (2 六 区 


上 面 的 讨论 说 明 线 性 关系 的 要 害 在 于 可 加 性 . 对 n 维 向 量 空间 R" 而 言 ,情况 也 大 抵 
如 此 . 显然 ,我 们 对 R” 中 的 “ 数 ”( 即 n 维 向 量 ) 定 义 了 “加 法 ”( 即 向 量 加 法 ) ,并且 满足 如 
下 的 交换 律 和 结合 律 (任意 @,p,Y € R" ): 

(Al) 加 法 交换 律 : 十 B == 十 a; (A2) 加 法 结合 律 : (xc 十 有 十 y 一 wx 十 (8 十 7). 

R" 中 还 有 一 个 特殊 的 度量 基准 点 被 当做 坐标 原点 ( 即 零 向 量 ) ,同时 在 任何 方向 上 
都 可 以 建立 数 轴 ，, 即 每 个 向 量 都 存在 反方 向 ,以 保证 向 量 在 两 个 相反 的 方向 上 都 是 无 限 
延伸 的 ,这 就 是 说 , R" 具有 下 列 加 法 单位 元 和 加 法 逆 元 ， 

(A3) 加 法 单位 元 , 即 存在 零 向 量 0 E 展 ”, 使 得 wx 十 0 一 wi 

(A4) 加 法 逆 元 , 即 对 任意 xc E R", 存在 一 a € R", 使 得 gag 十 (一 @) 一 0. 

对 线性 齐 次 函数 而 言 ,可 加 性 和 连续 性 可 以 推导 出 正比 例 性 ,这 对 于 R" 也 是 类 似 
的 . R" 中 的 “乘法 ” 即 数 乘 . 对 任意 w € RR", 显然 2g = (1 十 Da 二 lg 二 lg 二 a 十 @. 一 
般 地 , ka 就 是 & 个 @ 之 和 . 当然 ,这 要 求 R" 必须 先 满足 下 列 性 质 : 

(M1) 存 在 数 乘 的 单位 元 1, 使 得 1.w = 一 wi; 

(D1) 向 量 对 数 的 分 配 律 : (k 十 D@ = ka 十 a. 

由 于 R" 在 每 一 个 方向 上 都 具有 比例 关系 ,这 意味 着 它 还 满足 数 乘 的 结合 律 : 

CM2) 数 乘 的 结合 律 : kl(la) = (kD)a 

最 后 ,考虑 向 量 加 法 的 三 角形 法 则 , 即 若 把 @,pB,a 十 B 视 为 一 个 三 角形 ,那么 放大 k 售 
后 的 有 如, 邵 ,kla 十 B) 不 仅 仍然 构成 三 角形 ,而 且 与 原 三 角形 还 是 相似 的 ,此 即 R* 还 满足 
下 列 分 配 律 

(D2) 数 对 向 量 的 分 配 律 : R&C 十 有 ) = ka 


2.2.2 线性 空间 的 概念 及 性 质 

我 们 知道 ,向 量 是 特殊 的 矩阵 ,而 对 所 有 mXn 阶 的 实 和 矩 阵 的 集合 RR 而 言 , 它 对 拢 
阵 的 加 法 和 数 乘 封 闭 ,并 且 也 满足 上 述 8 条 运算 律 ,因此 也 是 “向 量 空间 ”. 当然 这 里 的 
“向 量 " 已 推广 到 实 和 矩阵 ! 按 此 思路 ,我 们 从 元 素 、 运 算 以 及 数 域 上 入 手 , 就 可 将 向 量 空间 
推广 到 更 一 般 的 线性 空间 “原始 人 "总算 进化 成 “文明 人 ”了 . 
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定义 2.2.2 考虑 非 空 集合 V 及 数 域 F 如 果 对 任意 wp E V, 都 存在 唯一 的 元 素 
6 EV 与 它们 对 应 , 则 称 6 为 a 与 p 的 和 , 记 作 6 一 @ 十 Bb. 同时 对 任意 & EF 及 a EV, 都 
存在 唯一 的 EV 与 它们 对 应 , 则 称 ng9 为 与 @ 的 数 乘 , 记 作 1g 二 ka. 如 果 加 法 和 数 乘 这 
两 种 运算 即 线性 运算 不 仅 封闭 (6 EV 且 数 乘 n9 EV ) ,还 满足 下 面 8 条 运算 律 , 则 称 V 
为 数 域 了 上 的 线性 空间 (linear space): 

(Al) 加 法 交换 律 :对 任意 wpE V, 都 有 w 十 8 一 有 +wi 

(A2) 加 法 结合 律 :对 任意 wp.Yy EV, 都 有 (a 十 让 十 Y= 二 a 十 (BB 十); 

(A3) 加 法 单位 元 , 即 对 任意 E V，, 都 存在 零 元 9 E V, 使 得 ga 十 0 = a; 

(A4) 加 法 逆 元 , 即 对 任意 a EV, 都 有 存在 一 wg EV ( 称 为 a 的 负 元 ) ,使 得 ga 十 (一 @) 


CMI) 数 乘 的 单位 元 , 即 对 任意 wEV, 都 有 1.w 王 wwi; 

(M2) 数 乘 的 结合 律 , 即 对 任意 wx EV 以 及 任意 kL EF, 都 有 k(la) 一 (kl)a; 

(D1) 分 配 律 1, 即 对 任意 wx EV 以 及 任意 &\L EF, 都 有 (十 Da 一 人 Mx 十; 

(D2) 分 配 律 2, 即 对 任意 wp EV 以 及 任意 & EF, 都 有 kla 十 PB) = ka 十 女 . 

几 点 说 明 : 

(1) 在 线性 空间 V 的 定义 中 ,不 仅 不 再 关心 元 素 的 特定 属性 ,而 且 也 不 关心 这 些 线性 
运算 ( 即 加 法 和 数 乘 ) 的 具体 形式 . 

(2) 在 上 面 的 定义 中 , 数 域 也 被 推广 到 了 更 一 般 的 数 域 F( 比 如 有 理 数 域 ). 当然 ,本 书 
中 数 域 F 仅 指 实数 域 R 和 复数 域 C, 此 时 相应 的 线性 空间 分 别 被 称 为 实 空 间 和 复 空间 . 

(3) 在 线性 齐 次 函数 和 R" 中 ,可 从 加 法 运算 推导 出 数 乘 运 算 . 但 线性 空 
未 必 可 取 极 限 ,也 未 必 连 续 ,因此 我 们 脱离 加 法 单独 定义 了 数 乘 . 当然 为 运算 方便 ,还 
求 它 满足 了 相应 的 运算 律 . 

《4) 因 为 向 量 空 间 是 最 特殊 的 一 种 线性 空间 ,所 以 本 书 有 时 也 将 线性 空间 中 的 元 素 
形象 地 称 为 向 量 ,尤其 是 在 论述 线性 空间 的 一 般 性 质 时 . 从 前 只 有 西施 和 貂蝉 才 是 美女 ， 
现在 则 是 美女 满 大 街 . 当然 ,对 于 元 素 类 型 已 知 的 线性 空间 ,我 们 一 般 会 尽 可 能 说 得 具体 
些 ( 比 如 和 矩阵、 多 项 式 、 函 数 等 ). 另外 ,请 读者 注意 ,有 些 书 中 是 将 这 两 种 空间 等 同 看 
待 的 . 

(5) 线 性 空间 是 线性 代数 的 最 基本 概念 之 一 ,概括 地 说 , 它 要 求 的 就 是 “两 种 封闭 运 
算 和 八条 运算 规律 ” 这 不 禁 让 人 别 叹 ; “二 八 佳人 , 引 无 数 英雄 竞 折 腰 . ” 

思考 :为 什么 会 有 两 条 分 配 律 ? 

例 2.2.1 全 体 mXn 阶 的 实 ( 复 ) 和 矩阵 组 成 的 集合 RR 或 C”*, 按 抢 阵 的 加 法 和 
数 乘 , 构 成 线性 空间 , 称 为 实 ( 复 ) 和 矩阵 空间 (matrix space). 

例 2.2.2 所 有 实 系数 多 项 式 ( 包 括 零 次 多 项 式 即 常 数 ) 组 成 的 集合 P[x], 按 
的 多 项 式 加 法 和 数 与 多 项 式 的 乘法 ,构成 线性 空间 ， et 二、 space). 
特别 地 ,次 数 小 于 的 所 有 实 系数 多 项 式 的 集合 P[xj,, 按 通 常 的 多 项 式 加 法 和 数 与 多 项 
式 的 乘法 ,也 构成 线性 空间 . 显然 R 就 是 了 Lz]. 

例 2.2.3 所 有 收敛 的 实数 数列 组 成 的 集合 ”，, 按 数 列 极限 的 加 法 和 数 乘 , 构 成 线 
性 空间 . 
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例 2.2.4 闭 区 间 [a,6] 上 的 所 有 连续 实 函 数 的 集合 CLa,bj, 按 通常 的 函数 加 法 
和 数 与 函数 的 乘法 ,构成 线性 空间 , 称 为 连续 函数 空间 (continuous function space). 

例 2.2.5 闭 区 间 [a,5] 上 的 所 有 nn 阶 可 微 实 函 数 的 集合 C "La ,oj, 按 通常 的 函数 
加 法 和 数 与 函数 的 乘法 ,构成 线性 空间 , 称 为 可 微 函 数 空间 (spaces of differentiable func- 
tions). 特别 地 , 闭 区 间 [a,5j] 上 的 所 有 无 限 阶 可 微 实 函数 的 集合 C*[a,o] 也 构成 线性 
空间 , 称 为 无 限 阶 可 微 函数 空间 . 

请 读者 注意 C'La,6b] 与 Cla,bj 的 区 别 和 联系 . 我 们 不 妨 将 CLa,b] 宽泛 地 看 成 
Ee 

例 2.2.6 对 任意 A € R” 和 任意 x € R", 全 体 矩 阵 向 量 积 4x ( 即 4 的 列 向 量 
组 的 线性 组 合 ) 的 集合 RC(A) 构成 数 域 R 上 的 线性 空间 , 称 为 矩阵 4 的 列 空间 (column 
space) ,或 与 A 对 应 的 线性 变换 ( 详 见 2.4 节 ) 的 值 域 (range) , 即 


R(A)=({y€E R”|y=Axr,x€E R",AE R™)} (2. 2. 4) 


例 2.2.7 所 有 nn 阶 常 系 数 线性 微分 方程 的 解 集 S = {y( 1L(y(W))==0) 是 C 上 
的 线性 空间 ,其 中 


L(y(D)) = SY a, + i Pty (ao ai ar E C) 


例 2.2.8 设 有 民 上 的 正 实数 集 民 *, 对 任意 4a,5E 民 - ,规定 加 法 运算 为 < 四 0 一 
ab， 乘法 运算 为 ka 一 必 , 这 里 任意 &E RR, 则 R* 按 这 种 加 法 运算 与 数 乘 运算 ,构成 
R 上 的 线性 空间 . 

证 明 : 易 知 R” 对 四 和 两 种 运算 封闭 ,并 且 对 任意 a,b,c E R1, 有 

a@PBb=a=6bOua, 
(aDBb) De=aw Be= ac=a(k)=a@B kk)=aDB LDO. 
由 a 外 1 二 a: 1 二 a 可知 零 元 0 三 1, 又 4 巾 o 一 aa 1 二 1 二 0, 故 a 是 a 的 (加 法 ) 
逆 元 . 
显然 , 当 上 二 1 时 有 la =aQ! = 失 而 且 对 任意 k,l E R 及 a,b € RT， 有 
EO (LOa) = (a) = (a =a = (kWa 
(kD) Oa=a=ala'=aDa=kOaDBiliia 
kO (aDb) =kEO wb) = (0 =ab: =aDBh =kWaDEYb 

证 毕 . 

例 2.2.9 设 有 民 上 的 集合 V = {@ 二 (&,&) | 所 ,& € RR}, 对 V 中 的 任意 元 素 
@ 一 (5 所) 和 及 一 (7, 疡 ) 以 及 任意 & GE 民 , 规定 如 下 的 加 法 四 和 数 乘 运算 @ : 


CQ 由 有 一 (6 十 力 ) 扣 十 六 十 生态 ) ,ac = (REl, KE; 二 kk— De) 


则 V 在 这 两 种 运算 下 构成 线性 空间 . 
以 上 两 个 例题 说 明 线 性 空间 定义 中 的 加 法 和 数 乘 仅仅 是 对 形式 运算 的 一 种 约定 俗 
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成 的 称呼 而 已 ,对 具体 问题 ,我 们 完全 可 以 给 出 自己 的 规定 . 我 们 再 次 强调 :线性 空间 中 
的 元 素 可 以 是 向 量 、 和 矩阵 多项式、 函数 等 ,其 中 的 线性 运算 可 以 “任意 ”指定 ,而 且 同 一 个 
线性 空间 还 可 以 指定 不 同 的 线性 运算 ( 例 2. 2. 9 中 的 显然 就 是 R*), 难 怪 这 个 “二 八 
佳人 ? 迷 倒 了 "无数 英雄 豪杰 ” 

例 2. 2. 10 非 齐 次 线性 方程 组 Ax = 二 b (这 里 A € RR” ) 的 解 集 


到 一 {x E RR” [x = 1 Ci@i | C»0» 二 二 人 EC] 462. 2, 9) 


不 构成 线性 空间 ,这 里 w ,@;,…,@, 是 对 应 齐 次 方程 组 Ax = 0 的 一 组 基础 解 系 , n 为 
Ax 一 六 的 一 个 特 解 . 
解 :显然 9 十 9 对 加 法 不 封闭 ,因为 A(n 十 人 D 一 24n 二 26 关 b, 即 二 9. 
例 2.2.11 所 有 n(n 这 1) 次 实 系数 多 项 式 的 集合 


= {fC | 7 一 ao 十 at 十 十 aoiraoyal 和 ya € Ra, 0} 


按 通常 的 多 项 式 加 法 和 数 乘 运 算 ,不 构成 民 上 的 线性 空间 . 

解 : 易 知 V 对 加 法 不 封闭 ,例如 对 f(D = 二 7, gD 一 1 一 PY, 有 f(D)+g()=1¢V. 

数据 处 理 中 ,对 数 坐标 非常 有 用 ,但 它 却 不 是 线性 的 . 例如 量度 地 震 的 里 氏 震 级 lg1 
每 增加 1 级 ,地 震 释放 出 的 能 量 强度 就 增 大 10 倍 . 还 有 颜色 空间 RGB, 虽然 我 们 以 三 原 
色 即 红 色 (i,0,0)、 绿 色 (0,j,0) 和 蓝 色 (0,0,&k) (i,j,k 二 0,1,2,…,255 ) 为 颜色 空间 
的 基 , 但 该 空间 里 显然 没有 负 向 量 ,而 且 基 不 能 任意 选取 ,所 以 颜色 空间 也 不 是 线性 

空间 . 

可 以 证 明 , 数 域 F 上 的 线性 空间 V 还 具有 下 列 性 质 : 

(A5) 零 元 8 是 唯一 的 ; 

(A6) 每 个 元 素 的 负 元 是 唯一 的 ; 

(A7) 当 @ 十 B= 二 a 十 Y 时 , 必 有 PB 二 7; 

(M3) 0¢ = 0, k0 = 0; 

(M4) 当 ka = 二 0 时 , 必 有 k= 二 0 或 @ 一 


2.2.3 线性 空间 的 基 、 坐 标 及 其 变换 


向 量 空间 中 向 量 组 的 线性 组 合 .线性 表示 、 线 性 相关 与 线性 无 关 、 等 价 . 极 大 无 关 组 、 
秩 以 及 向 量 空间 的 基 、 坐 标 、 维 数 等 概念 和 结论 ,都 可 以 自然 地 推广 到 线性 空间 . 这 里 我 
们 仅 关心 一 些 易 混 消 的 地 方 , 其 余 不 再 袭 述 , 

例 2.2.12 向 量 空间 C 是 实数 域 R 上 的 二 维 空间 ,其 基 可 取 为 1{1,z)， 

C=span(l,i) 一 (1 十 ia0E R} 
同时 ,向 量 空间 C 也 是 复数 域 C 上 的 一 维 空间 ,其 基 可 取 为 { 
C=span(l)= {k,l1,kE C} 

例 2.2.13 对 于 例 2.2. 8 中 的 线性 空间 R1. 设 有 某 个 a€ Rt 且 a 关 1, 由 于 对 

任意 5 € R ,由 对 数 恒等式 2 一 aww*, 都 存在 唯一 的 上 一 log,b € R, 使 得 6 = a = 
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ka, 因此 R* 的 基 可 取 任 意 非 1 的 正 数 a, 即 线性 空间 民 ” 的 维 数 为 1. 

定理 2.2.2  ( 基 的 扩张 定理 ) 数 域 了 上 的 ” 维 线性 空间 V 中 ,任意 一 个 线性 无 关 组 
i ;G2 《7 二 1,2,…,n) 都 可 以 扩充 成 V 的 一 组 基 . 

证 明 : 由 基 的 定义 可 知 必要 性 成 立 ,下 面 给 出 充分 性 的 证 明 . 

如 果 坟 二, 则 @i,@2，,…,@, 已 是 V 的 一 组 基 , 结 论 得 证 ;如 果 r 二 nn, 令 


人 太一 span(@ OQ ,0,) 


则 必 有 or EVEHa. ¥ W,， 使 得 CGI， 0 0 线性 无 关 ,否则 对 任意 太 E V 一 W, 可 
知 wa, 有 线性 相关 , 即 有 PE W, 这 与 BEV 一 W 矛盾 . 

如 果 ”十 1 三 2 则 oa 就 是 V 的 一 组 基 , 结 论 亦 得 证 . 如 果 十 1 过 则 
更 新 W 为 W 二 span(@i,*……,Q; ,01)， 重复 上 述 做 法 ,可 找 出 gx EV 有 征 @, EW, 使 得 
Ql1…,Q, ,Qi ,Qs 线性 无 关 . 

依次 下 去 ,由 于 nn 的 有 限 性 ,最 终 必 可 得 V 的 一 组 基 @1,…,@, ,Qi ，…,@,. 证 毕 . 

基 的 扩张 定理 给 我 们 提供 了 寻找 有 限 维 线性 空间 的 基 的 常规 方法 ,也 说 明了 基 不 是 
唯一 的 . 但 一 旦 确定 了 基 , 元 素 的 坐标 却 是 唯一 的 . 

定理 2.2.3 数 域 了 上 的 线性 空间 V 中 ,任意 元 素 在 给 定 基 下 的 坐标 是 唯一 的 . 

例 2.2.14 已 知 多 项 式 空间 PLxj;. 

(DD) 证 明 : 刻 二 1,f2 二 Zz,f3 二 Xx 是 PLzj; 的 一 组 基 ( 称 为 PLrj; 的 标准 基 ); 

(2) 求 多 项 式 /二 3 十 2z 十 4x? 在 标准 基 下 的 坐标 向 量 x; 

(3) 证 明 : g 二 1, gz 二 Xx 一 2, g3 二 (7 一 2 也 是 PLxj; 的 一 组 基 , 并 求 有 1,fi,f; 及 
f 在 此 基 下 的 坐标 向 量 pi,pz,ps 及 y. 

证 明 :(1) 易 知 i=1,f= xr = bp 线性 无 关 , 因 为 当 Rifitkfztksfs =0H, 
由 多 项 式 性 质 可 知 包 二 ko 三 局 王 0. 另外 ,对 PLzj 中 任意 多 项 式 p(x) 二 ao 十 wz 十 
az ， 显然 其 坐标 向 量 x 一 (ao ,ai az) 7 是 唯一 的 ,因此 所 ,fi,f; 是 PLxj; 的 一 组 基 , 即 
dimP[z]: = 3. 

(2) 由 (1) 知 所 求 工 三 (3,2,4)T. 

(3) 易 证 g1 ,sg ,83 线性 无 关 , 这 是 因为 当 gi 十 kg2 十 3g3 一 0 时 , 即 


(ki 一 2k; 十 4k;) 十 (CR> 一 4R3) 式 十 Ra 并 一 0 


从 而 Al = k: = ks = 0. 色 PLz]s 的 维 数 为 3, 因 此 B182，83 也 是 P[ zx]; 的 一 
组 基 . 

由 高 等 数学 中 的 泰勒 公式 ,可 知 

fi=1:1+0. (zr—2)+0.(r—2)=1.g+0. g++0. gs 

户 王 2。1 十 1。(z 一 2) 十 0。(z 一 2)2 一 2。g 十 1。go 十 0。gs 

有 户 一 4.1 十 4。(z 一 2) 十 1。(z 一 2)2 一 4。8 +4. gl. gs 

J =23 .1 十 18。(z 一 2) 十 4。(z 一 2)2 一 23。gi 十 18 .go 十 4。gs 

所 以 ,所 求 坐标 向 量 分 别 为 pi 二 (1,0,0)7,P 二 (2,1,0)T,ps 一 (4,4,1)7 和 y 一 
(23,18,4)T. 

将 此 例 推广 到 PLxj,, 易 知 PLzj], 的 标准 基 为 
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fi = 1,f; = zx, fs i 王 wl 
因而 dim PL[xj, 二 n. 而 PLxj 的 标准 基 则 为 
A 1,f: rx,f3 x, fs, = = ZX" 
这 说 明 dim PLzxj] = 十 w, 即 PLxj 是 无 限 维 线性 空间 . 
如 果 将 PLzj 的 两 组 基 分 别 从 形式 上 记 成 “向 量 ”( 万 , 户 , 户 ) 和 (gi,gs,g83), 那么 
形式 上 也 有 
gi = (fi,fzsf3) pigs = (fisfs, fa3) py8s = (fi,f2, fi) Pp; 


进一步 地 ,如 果 将 坐标 向 量 排列 成 坐标 和 矩阵 P= 二 (pi,p:,ps), 那么 形式 上 也 有 基 变 
换 公式 


1 =2 4 
(gi18283) = (fi,f2,f3)10 1 —4|= (fi,fe,fs3) (pip ps3) = (fisfz, fs)P 
0 0 J 


定义 2.2,3 设 Ql1 02 ,0 和 Pi ,Pp: 0 :及 ， 是 ?7 维 线性 空间 V 的 两 组 基 , 且 存在 和 矩 
阵 P, 使 得 


(gi 记忆 ) = (0l ,0z 0 )P (0) 
则 称 式 (2. 2. 6) 为 基 变 换 公式 , 称 和 矩阵 书 为 基 ,es，…,@, 到 基 忆 ,PB,,…,B, 的 过 渡 


矩阵. 

当 V 为 向 量 空间 R" 时 , @i ,0@z,…,@, 是 线性 无 关 的 n 维 列 向 量 组 ,因此 式 (2. 1. 3) 
成 立 . 但 对 于 一 般 的 线性 空间 , 式 (2. 1.3) 未 必 成 立 , 因为 此 时 形式 上 的 “向 量 ”(@， 
Qs，…,0) 未 必 是 矩阵 ,更 亿 论 是 否 可 逆 . 这 是 线性 空间 V 与 向 量 空间 R" 之 间 的 一 个 重 
大 区 别 . 当然 ,这 种 形式 上 的 简便 写法 ,在 仅 涉 及 加 法 和 数 乘 运算 时 ,矩阵 运算 规律 仍然 
成 立 . 

过 渡 和 矩阵 P 了 是 以 新 基 , 忆 ,… ,的 各 基 向 量 在 旧 基 1 ,wz ,…',o 下 的 坐标 向 量 为 
列 向 量 构成 的 坐标 矩阵 , 它 一 定 是 可 逆 和 矩阵 . 事实 上 , 若 和 矩阵 己 不 可 逆 , 则 以 也 为 系数 和 矩 
阵 的 齐 次 线性 方程 组 Pk = 0 有 非 零 解 大 一 (Ai 名)T, 因此 


kiB 十 kp 十 pp 3 (pl ,Pp ，"** ,PB,)k = (Qi 02 ,°° 0) Pk = (a 02000000 一 0 


从 而 房 , 庐 ,及 线性 相关 . 这 与 记 ,p,,…,p 是 一 组 基 矛 盾 . 所 以 王 是 可 逆 的 . 

定理 2.2.4 设 维 线性 空间 V 中 元 素 c 在 基 wi ,as ，…,ou 与 基 房 ,应 ,…, 及 下 的 坐 
标 向 量 分 别 为 x 二 (zyzz ,zo) "和 yy 二 (yyo，… yo)" 了 为 基 @1 va，…os 到 基 肠 ， 
BP.,…,B, 的 过 渡 和 矩阵 , 则 成 立 坐标 变换 公式 ， 


XxX 二 Py 或 者 y= 二 Pix C2 2 
证 明 : 由 于 0 一 (ai 9 0 x 及 a = (gi "Bi)y, 注意 到 式 (2 2. 6)， 代入 可 知 


& = (PB ,my 一 《Cl ,02 0 PPy 
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再 根据 定理 2. 2. 3 即 得 x = Py. 由 于 PP 可逆 ,因此 亦 有 y= 二 Px. 
例 2.2.15 由 例 2.2.14 可 知 , /在 基 f/,f;,fs 下 的 坐标 向 量 为 x 二 (3,2,4)", 而 


1 ==2 进 
是 基 ,fi,fs 到 基 g1 ,go ,gs 的 过 渡 和 矩阵 为 P 二 0 1 一 4 ， 所 以 f 在 基 gg ,gz ,gs 
0 0 1 


下 的 坐标 向 量 为 
1 2 4)/3) /23 
y=P'x= |0 1 4||2|= |18 
0 0 1)l4 4 
思考 :从 计算 》 的 计算 量 看 ,这 里 的 方法 比例 2. 2. 14 中 的 方法 大 ,那么 其 意义 又 何在 呢 ? 
例 2.2.16 已 知 矩 阵 空 间 R” 中 的 两 组 矩阵 : 


0 Ll 0 0 1 0 1 
(TI) :4， | ,4: Fk ,A; = ,As ; 
WO = 1 i 8 
1 1 1 EE 0 
(II) : 且 ) 一 , 卫 ， es .B; | ,B, < 一 6 
1 0 0 0 0 0 


(1) 证 明 (IT) :4 ,4 ,A; ,A 和 (I1):B' ,B, ,B; ,B, 都 是 民 22 的 基 ; 
(2) 求 基 (1) 到 基 (II) 的 过 渡 和 矩阵 C; 


b 
E RR 在 基 (1) 和 基 (ID 下 的 坐标 向 量 x 和 y. 
c 
解 :(1) 易 知 4 ,A; ,A; ,As 线性 无 关 , 因 为 车 有 ki 4 十 包 As 十 kA; 十 kAs 二 O, 则 
ki 十 kz 0,ksa = == 0 ,ks — Ek = 0,ki — kk; 一 0 


(3) 分 别 求 任意 矩阵 4 一 


b 
解 得 &1 二 ks = 二 k= 二 = 二 0. 又 对 任意 矩阵 4 一 ( J)e 民 22 ,有 


着 二 六 (十 dl) Fa 十 去 (a 一 ) A 十 去 (6 十 A, + 去 (6 一 人 4， (2.2.8) 
因此 , (D :4 ,4 ,4; ,4 是 R” 的 一 组 基 , 且 dimR”? 一 4. 

类 似 地 ,可 知 Bi ,B;,B;,B, 线性 无 关 , 日“ 向 量 ” 个 数 等 于 dimR””, 因此 (IT :B， 
B,,B;,B, 也 是 RR 的 一 组 基 . 

(2) 联 想到 第 1 章 中 用 到 的 基本 和 矩阵 ,并 注意 到 A 一 aEilbbEy cE -+dE, 这 里 


0 0 1 0 0 0 0 


,El 一 :下 2 一 


E21 一 


1 
(CIII) :El = 
0 


有 由 0 1 
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易 知 (IID:E' ,El ,El ,Ey 也 为 RR 的 一 组 基 ( 称 为 RY 的 标准 基 ). 

显然 人 二 Bi 十 Ew 二 1: En 十 0: Ew 十 0， Ez 十 1]* Es, 所 以 A 在 标准 基 (II1) 
下 的 坐标 向 量 为 (1,0,0,1)7. 类 似 地 , 4; ,A 和 A; 在 标准 基 (IIT) 下 的 坐标 向 量 分 别 为 
(1,0,0, 一 1)7,(0,1,1,0)7 和 (0,1, 一 1,0)7. 因此 , 基 (II) 到 基 (1) 的 过 渡 和 矩阵 为 


1] 1 0 W 
ga 0 工 
和 省 让 二 4 


同 理 , 可 得 基 (IID 到 基 (1) 的 过 湾 和 矩阵 为 
i 1 和 六 
f JT 1 
C; = 
1 1 0 0 
1 0 0 0 


由 于 (Al sA> ,As sAy) 9 (El yy yD ,BE;, ) CO 3 此 即 (El yy ,五 ?1 ， EF,, ) (Al ,A» ' 
A;,A4) CT ,将 之 代入 到 (Bi,B;,B;,B,) 二 (Eii ,Ei ,Ez ,E:) C 中 , 即 得 


(B, .B, .B; ,B,) = (Ai ,A; ,A3 ) 鸡 1) Cr C: 


也 就 是 说 

1 ， 沿 ) 轴 1 二 时 区 和 

1 |1 9 惕 ”二村 由 下 业 驳 jo0 1 1 ¥ 
C= = 

Q 1 1 0 1 1 站 少 2 昂 】 故 


日 一 0 0 1 0 


(3) 由 式 (2. 2. 8) 可 知 x 二 六 (a 十 可 ja 一 避 沿 十 G5 一 二 "我们 换 一 种 方式 来 来 六 


由 (2) 知 A 在 基 (IID 下 的 坐标 向 量 为 z= 二 (a,5,c,d)', 而 基 (IIIT) 到 基 (JI) 的 过 渡 矩 
阵 为 Cs, 因此 由 式 (2.2.7) 可 知 y 二 Cs z= (dsc 一 d,b 一 cra 一 0b).. 

注意 :这 里 我 们 引入 六 标准 基 ? 作 为 中 介 , 因 为 矩阵 在 其 下 的 坐标 就 是 相应 和 矩阵 元 素 . 
题 中 (4 ,4 ,A; 4) 等 记号 仍然 是 形式 上 的 “向量 ”, 没 有 逆 和 矩阵 ,所 以 不 满足 式 (2. 1. 3). 

由 于 五 ,EPE 是 RR” 的 标准 基 , 因 此 dimR” == 4 二 2X2, 这 个 结果 显然 
可 推广 到 RR , 即 dimRR” 二 mn. 而 R” 的 标准 基 , 其 实 就 是 基本 和 矩阵 组 


El ,Eizs ,Es 下 21 Ei Er ,EF,,» yue Bs (2. .99) 


例 2.2.17 满足 A' = A 的 实 矩 阵 A 称 为 实 对称 和 矩阵 (symmetric matrix). 
(1) 证 明 所 有 二 阶 实 对 称 和 矩阵 4 的 集合 SR 天 构成 民 上 的 线性 空间 ; 
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(2) 求 SR” 的 一 组 基 . 
解 : (1) 留 给 读者 作为 练习 . 
(2) 对 任意 A E SR2 尖 ,由 于 4 一 4, 故 有 


1 0 0 1 0 0 


a DO 


第 王 一 十 0 站 =aE+obE,+cekE; 


区 ”次 1 @ 0 


又 易 证 Ei,E,,E:; 线性 无 关 , 因 此 Ei,E;,E:; 即 为 所 求 . 
推广 到 阶 , 易 证 所 有 阶 实 对 称 和 矩阵 的 集合 SR” 仍然 构成 民 上 的 线性 空间 . 如 
果 再 注意 到 n 二 2 时 FE = 下 1 下; = FE,E; = EE,, 则 可 得 SR 的 一 组 基 为 


Fi ,Fy ,oe , PF; 23 EY EE SY (2 LO 


0 0 


其 中 ,及 =E,F, =E,+E; (i,j=1,2,…n 有 fj>i), 此 即 dmSR™ = 去 n(n 十 


思考 :如 果 n 阶 实 矩阵 4 满足 A' = 二 一 4A, 则 称 A 为 反对 称 和 矩阵 (anti-symmetric 
matrix) 或 斜 对 称 和 矩阵 (skew-symmetric matrix). 对 所 有 n 阶 反 对 称 和 矩阵 的 集合 SSR™ 
而 言 , 上 述 问题 的 结果 又 是 什么 呢 ? 


2.2.4 线性 空间 的 同 构 


从 例 2. 2. 7 易 知 ,线性 微分 方程 9 关 二 x 二 0 的 解 集 是 一 个 线性 空间 . 从 物理 上 看 ,此 


方程 的 解 x(z) 恰好 描述 了 质点 的 某 种 运动 方式 . 因此 一 旦 给 定 质点 的 初始 位 置 x(0) 一 
和 初始 速度 x (0) = ”" 就 可 以 确定 质点 在 任意 时 刻 的 运动 状态 方程 . 这 意味 着 方程 的 解 
x(7?) 也 可 以 用 有 序 向 量 组 (p,v) 来 表示 . 

显然 ,这 两 种 表示 间 的 关系 是 线性 的 , 即 若 有 序 向 量 组 (q,w) 对 应 y(7), 则 (p 十 gq， 
v 十 w) 是 解 x(7) 十 y(7) 的 初 值 条 件 , 且 (如 ,和 如) 对 应 Ar(0). 

这 种 联系 并 不 是 偶然 的 . 比如 线性 空间 V 中 的 任意 元 素 w 二 xi@ 十 as 十 … 十 
Zi， 在 给 定 基 ol ,az ,0 下 ,与 向 量 空间 所 中 的 向 量 x 二 《zi ,…,z)' 是 一 一 对 应 
的 , 即 在 维 线性 空间 V 与 Fr" 之 间 , 实 质 上 存在 一 个 映射 下 :a -xz, 而 且 天 既是 单 射 又 
是 满 射 , 即 一 一 映射 或 双 射 . 

更 一 般 地 ,可 以 引入 两 个 线性 空间 之 间 的 类 似 联 系 , 即 同 态 与 同 构 . 

定义 2.2.4 ( 同 态 映射 ) 设 Vi,V, 是 数 域 F 上 的 两 个 线性 空间 , 下:Vi hyV; 是 W 到 
Vi 的 映射 (未 必 一 一 对 应 ). 如 果 对 任意 a,B E V1 和 任意 &E F, 都 有 

(G) 可 加 性 :大 (Ca 十 有 ) 一 大 (ao) 十 大 (有 . 

(2) 齐 次 性 :天 (Ma) 一 4 大 (Ca). 

则 称 天 为 Vi 到 Vs 的 (线性 ) 同 态 上 映射 (homomorphism) 、 线 性 映射 (linear mapping) 或 线 
性 算 子 (linear operator), 特别 地 , 当 V 为 F 时 , 称 天 为 Vi 上 的 线性 泛 函 (linear functional) ; 
当 Vi 与 V; 是 同一 个 线性 空间 V 时, 称 大 为 V 上 的 自 同 态 映射 (endomorphism) 或 线性 变 
换 (linear transformation ), 

可 以 证 明 ,可 加 性 与 齐 次 性 合 在 一 起 就 是 线性 性 . 

(3) 线 性 性 :下 CRw 十 1) 一 大 (ao) 十 /大 (有 ,wpEV AGERR 
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请 读者 注意 ,有 的 书 中 将 线性 映射 与 线性 变换 统称 为 线性 变换 ， 
例 2. 2.18 考虑 线性 空间 V 中 的 平移 变换 (translation transformation) 
AM: 0 PO 十 Co 


其 中 , mm 为 V 中 的 某 个 特定 的 非 零 向 量 . 显然 A4 是 一 一 对 应 的 ,但 却 不 是 线性 变换 ， 
因为 


M20) = 2g oo0) A200) = 2 Ma) 


定义 2.2.5 ( 同 构 映射 ) 设 Vi ,Vs 是 数 域 了 上 的 两 个 线性 空间 ,如 果 天 :WwW F>V: 是 
Vi 到 V 的 (线性 ) 同 态 映射 ,并 且 是 一 一 对 应 的 , 则 称 天 为 到 V， 的 (线性 ) 同 构 映 射 
(isomorphism) ,并 称 Vi 与 V; 同 构 (isomorphic) , 记 为 ca VY;. 

显然 , 同 构 映 射 是 特殊 的 同 态 映射 . 

借用 几何 直观 ,可 称 & == 下 (@) 为 @ 在 下 下 的 像 (image), 称 0 为 ao 二 下 (a) 在 大 下 
的 原 像 (inverse image) ,此 时 ,可 加 性 意味 着 “和 的 像 等 于 像 的 和 ”, 即 天: 十 Be’ 十 PB ， 
齐 次 性 则 意味 着 “ 数 乘 的 像 等 于 像 的 数 乘 ”, 即 下 :ka Fa . 这 也 就 是 说 , 同 构 映射 保持 了 
加 法 与 数 乘 运算 , 即 原 像 之 和 对 应 于 像 之 和 , 数 乘 原 像 对 应 于 用 同一 个 数 去 乘 像 . 以 此 观 
之 , 同 构 映射 还 具有 下 列 性 质 : 

定理 2.2.5 ( 同 构 映射 的 性 质 ) 设 下 是 数 域 F 上 线性 空间 Vi 到 VV 的 同 构 映 射 , 则 

(了 1)( 零 元 对 应 零 元 ) (0) 一 9, 其 中 0 是 Vi 的 零 元 , 0 是 Vs 的 零 元 ; 

(12)( 负 元 对 应 负 元 ) 天 (一 o) 二 一 下 (@); 

(13)( 释 加 性 或 线性 性 ) 天 (io 十 Rots 十 … 十 Gs) 一 局 大 (oi) 十 已 大 (os) 十 … 十 
k, F(a,); 

(I4) (线性 无 关 组 对 应 线性 无 关 组 ) Vi 中 的 向 量 组 @ ,oz ,…,@, 线性 无 关 的 充 要 条 
件 是 V; 中 的 向 量 组 下 (@) ,天 (os ) ,… ,下 (@,) 线性 无 关 . 

例 2.2.19 在 同 构 映射 oc(a) = lga 下 , R11 电 民 ,这 里 的 民 + 见 例 2. 2. 8. 

R 民 -安民 表明 , R* 中 的 乘法 和 乘 方 分 别 对 应 于 RR 中 的 加 法 和 乘法 ,这 就 是 对 数 运算 的 
理论 依据 . 作为 17 世纪 数学 的 三 大 成 就 之 一 (另外 两 个 是 解析 几何 的 创立 和 微 积分 的 建立 )， 
对 数 运算 的 伟大 之 处 正在 于 借助 这 种 同 构 关系 ,把 民 ”中 复杂 的 乘法 和 乘 方 运算 转化 为 R 中 
简单 的 加 法 和 乘法 运算 . 下 面 的 定理 告诉 我 们 ,这 类 转化 在 数学 里 仅仅 是 沧海 一 票 而 已 . 

定理 2.2.6 (线性 空间 的 同 构 定理 1) 数 域 F 上 的 维 线性 空间 V 绽 F. 

证 明 : 根 据 前 面 的 分 析 , 对 映射 王 :V PK", 即 


F | 
C= x 二 za EV x= EF 


易 证 大 是 同 构 映射 , 证 毕 . 
显然 ,V 衬 严 意味 着 在 干 差 万 别 的 V 中 ,无 论 “ 向 量 ” 如 何 “ 美 丑 妍 媒 ”, 无 论 涉及 的 运算 
如 何 千奇百怪 ,最 终 都 可 归结 为 对 “向 量 ” 坐 标的 计算 ,也 就 是 数 的 运算 . 如 此 说 来 ,向 量 空 间 
已 并 不 只 是 一 个 特殊 的 维 线 性 空间 , 它 是 我 们 选 出 的 “代表 ”, 集 万 干 宠爱 于 一 身 . 
再 来 看 线性 空间 的 维 数 . 数 域 F 上 的 维 线性 空间 Vi 旦 户 ,m 维 线性 空间 V; 宇 FP" 
显然 Vi > Ws 等 价 于 户 " Fr, 也 就 是 m 二 nn. 
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定理 2. 2.7 (线性 空间 的 同 构 定 理 2) 数 域 了 上 的 任意 两 个 有 限 维 线性 空间 同 构 的 
充 要 条 件 是 它们 有 相同 的 维 数 . 

这 说 明 , 维 数 是 有 限 维 线性 空间 唯一 的 本 质 特 征 ， AN 
间 可 以 不 加 区 分 ,它们 最 终 都 归结 为 一 个 数 ,这 真是 万物 丝 数 ”.“ 道 生 一 ,一 生 二 ,二 生 
三 ,三 生 万 物 ”. 面 对 “ 数 ”这 个 “万 物 之 本 ”, 我 们 不 禁 要 陷入 深思 : 维 数 究竟 为 何 物 ? 


2.2.5 向 量 空间 的 历史 :狂飙 的 数学 


对 电影 (悲惨 世界 》(2012 版 ) 中 的 沙 威 ,大 家 肯定 印象 深刻 . 
他 的 原型 在 自己 的 文集 中 写 道 :“ 在 6 月 2 日 ,有 两 三 千 共 和 党 人 
参加 了 莱 伽 罗 瓦 的 磊 礼 游行 ,他 们 (原本 ) 打 算 返 回 时 开始 设置 路 
障 ……” 这 里 的 莱 伽 罗 瓦 是 伽 罗 瓦 (Galois, 见 图 2- 5) 的 误 拼 . 伽 
罗 瓦 的 命运 是 如 此 悲惨 ,以 至 于 连 引 燃 起 义 的 机 会 都 没 得 到 ， 当 
然 , 他 的 翡 剧 既 与 他 古怪 和 病态 的 性 格 有 关 , 也 与 1830 年 前 后 法 
国 动荡 的 社会 密切 相关 . 在 他 短暂 但 充满 青春 和 激情 的 21 年 人 
生 中 ,他 经 历 两 次 考试 失败 ,两 次 手稿 被 人 遗失 、 两 次 人 狱 . 父 亲 
惨死 等 人 生 打 击 . 

如 果 没 有 1832 年 5 月 30 日; 清晨 巴黎 郊外 森林 中 的 那 场 。 
决斗 ,如 果 天 才 伽 罗 瓦 没 有 因子 弹 击 中 腹部 ,如 果 柯 西 和 傅立叶 “ 
(Joseph Fourier) 等 审 稿 人 没有 两 度 遗 失 他 提交 给 法 国 科 学 院 的 
手稿 ,如 果 泊 松 读 懂 了 他 的 第 三 份 手稿 …… 那 么 件 罗 瓦 伟 大 的 洞察 力 或 许 能 提前 半 个 世 
纪 为 人 所 知 , 群 论 旋 至 抽象 代数 或 许 也 会 更 早 地 来 到 人 间 . 历史 不 能 假设 . 但 是 ,在 决斗 
前 夜 反复 提 到 ”我 没有 时 间 ?” 的 状况 下 , 伽 罗 瓦 非 常 清楚 自己 匆匆 写 下 的 这 些 混乱 的 东西 
“将 会 非常 有 用 ”, 因 此 他 “请 求 雅 可 比 (Carl Jacobi) 或 高 斯 评判 这 些 定理 是 否 重要 ,而 不 
是 是 否 正 确 ”. 

伽 罗 瓦 在 “开创 性 和 概念 的 深 选 方面 无 人 能 及 ” 他 最 主要 的 成 就 是 提出 “ 群 ”" 的 概 
念 ,彻底 解决 了 代数 方程 根 式 求 解 问题 ,并 由 此 发 展 出 一 整套 关于 群 和 域 的 理论 , 即 伽 罗 
瓦 理论 . 由 此 ,古代 数学 三 大 难题 中 的 三 等 分 任意 角 和 倍 立 方 体 等 都 是 不 可 能 的 . 

伽 罗 瓦 的 思想 主要 体现 在 他 1831 年 提交 的 手稿 (关于 用 根 式 解 方程 的 可 解 性 条 件 》 
之 中 ,其 中 扼要 地 证 明了 以 下 结果 : 

假定 a, B, 7Y, … 是 方程 的 根 ( 他 默认 该 方程 不 可 约 , 且 所 有 根 互 不 相同 ), 则 a, 8， 
7,，… 的 一 个 置换 群 (他 称 为 方程 的 群 ) 满 足下 列 性 质 : 

(1) 每 个 在 群 的 蔡 换 下 不 变 的 根 的 函数 是 有 理 的 ; 

(2) 反 之 ,这 些 根 的 每 一 个 有 理 函 数 在 这 些 置 换 下 都 是 不 谈 的 . 

然后 伽 罗 瓦 开始 探求 该 结果 在 方程 可 解 性 问题 上 的 应 用 . 

令 尺 是 由 添加 字母 或 未 知 数 户 .dg 到 有 理 数 中 而 得 到 的 域 , 即 由 pg 的 有 理 表 达 式 所 
形成 的 域 . 那么 方程 x 十 px* 十 gq 二 0 的 四 个 根 是 : 
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2-5 伽 罗 瓦 自画像 
(1811 一 1832) 
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其 中 ,A 二 =p’ 一 4g. 
显然 ,在 R 中 成 立 美 系 底 1 十 总 一 0，Zs ey 一 外. 考虑 四 个 根 的 种 置换 41 二 24, 其 中 
使 得 前 面 的 两 个 关系 保持 成 立即 不 变 的 是 下 列 八 个 置换 : 
Ei=(1234), E,=(2134), E;=(1243), EF,=(2143) 
E:=(3412), Es=(4312), E;=(3421), Es=(4321) 


可 以 证 明 , 在 所 有 置换 中 ,这 八 个 置换 是 使 得 根 在 中 的 全 部 关系 都 保存 不 变 的 置换 ， 
因此 它们 便 是 这 方程 在 R 中 的 群 G. 

现在 考虑 新 关系 好 一 好 , 即 VA ,将 它 添加 到 RR 中 ,形成 新 的 域 R , 即 包含 R 和 vA 的 
最 小 的 域 . 此 时 只 有 前 四 个 置换 El ，…, EE, 使 得 R' 中 的 这 个 新 关系 保持 不 变 , 因 此 它们 
就 是 方程 在 R' 中 的 群 互 . 事实 上 ,这 里 的 互 是 G 的 子 群 , 它 的 阶 为 4 ,指数 为 之 一 2, 是 G 
的 最 大 子 群 .由 G 确定 互 后 ,可 找到 一 个 根 的 函数 w 前 例 中 p 一 寺 一 妈 ). 这 可 以 通过 一 
个 阐述 为 群 及 的 指数 的 部 分 预 解 式 求 得 (前 例 中 是 一 (p? 一 4g) 二 0) ,将 g 二 VA 添加 到 
R 中 ,形成 新 的 域 R' ,因此 方程 关于 域 R' 的 群 就 是 了 H. 

重复 上 述 过 程 ,直至 方程 关于 某 域 R 的 群 恰 是 恒 等 置换 | 时 ,方程 的 根 就 都 属于 在 
该 域 R 中 . 而 这 个 域 是 由 已 知 域 通过 逐次 添加 已 知 量 得 到 的 . 

接着 伽 罗 瓦 引入 正规 子 群 的 概念 ,并 在 其 手稿 和 决斗 前 夜 给 朋友 的 信 中 推断 :方程 
是 根 式 可 解 的 , 当 且 仅 当 所 找到 的 正规 子 群 序列 ( 即 合成 序列 ) 中 所 有 子 群 的 指数 都 是 素 
数 , 即 方程 的 群 是 可 解 群 . 

在 其 短暂 的 一 生 中 , 伽 罗 瓦 的 成 果 总 共 不 到 60 页 ,后 来 刘 维 尔 (Joseph Liouville， 
1809 一 1882) 整 理 了 伽 罗 瓦 的 大 部 分 遗 稿 ,并 于 1846 年 刊登 在 (纯粹 与 应 用 数学 杂志 》 
上 . 该 刊 是 刘 维尔 于 1836 年 创立 的 , 旨 在 刊登 纯粹 与 应 用 数学 领域 所 有 分 支 的 论文 ， 
是 有 关 19 世纪 中 期 的 40 年 里 数学 活动 的 重要 文献 . 对 伽 罗 瓦 事件 , 刘 维 尔 评述 道 ， 
“一 个 才智 过 人 的 考生 由 于 弱智 的 主考 官 而 落榜 ,因为 他 们 不 理解 我 ,我 是 一 个 野 
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20 年 后 ,矩阵 论 的 创始 人 凯 莱 (Arthur Cayley, 见 图 2- 6) 在 
《 群 论 兴 1854 年 ) 中 首次 给 出 了 有 限 群 的 抽象 定义 , 即 群 是 “不 
同 符号 1,c,8,… 的 集合 ,其 中 任何 两 个 元 的 乘积 (不 计 顺 序 )， 
或 者 任何 元 与 自身 的 乘积 ,都 属于 这 个 集合 . ” 接 下 来 他 给 出 了 
几 个 例子 (四 元 数 、 可 逆 和 矩阵 .排列 等 ). 他 还 展示 了 4 个 元 素 的 
两 个 可 能 群 的 群 表 及 6 个 元 素 的 两 个 群 表 . 他 的 文章 也 没有 引 
起 共鸣 ,因为 “过 早 的 抽象 落 到 了 老子 的 耳 杀 里 ,无 论 它 们 是 属 
于 数学 家 们 的 还 是 属于 大 学 生 们 的 .”(M. 克 莱 因 ) 后 来 ,在 
1878 年 , 凯 莱 重 述 了 他 的 定义 和 结论 ,并 指出 “和 群 是 由 符号 以 及 
所 满足 的 运算 律 来 定义 的 ” 

有 限 群 完整 的 公理 化 描述 最 早 是 由 韦伯 (Heinrich Martin 
Weber,1842 一 1913) 在 1882 年 一 篇 论述 二 次 型 的 文章 中 给 出 的 ,具体 如 下 : 

由 个 任意 元 素 01,0,…,0 组 成 的 系统 G 被 称 为 阶 数 为 h 的 群 ,如 果 它 满足 下 列 


图 2-6 凯 莱 (1821 一 1895) 


第 2 章 线性 空间 与 线性 变换 。 65 。 


条 件 : 

(1) 通 过 某 个 被 称 之 为 复合 或 相 乘 的 法 则 ,可 以 从 系统 G 中 的 任意 两 个 元 素 导 出 G 
中 的 一 个 新 元 素 . 用 符号 表示 ,就 是 0,4, 王 0. 

(2) 总 有 (9,0.)0, 二 0,(0.0,) 一 0,0.0, 成 立 . 

(3) 从 99, 二 90,, 或 从 00 二 0.0, 可 得 9, 二 0.. 

显然 ,韦伯 的 定义 没有 涉及 元 素 的 特性 . 虽然 下 . 克 莱 因 (Felix Klein,1849 一 1925) 持 
保留 意见 ,但 它 却 在 1890 年 得 到 公认 ,因为 在 当时 ,人 们 已 发 现 了 好 几 种 重要 的 群 :排列 
群 . 阿 贝尔 群 、 离 散 变 换 群 (有 限 的 与 无 限 的 ) ,并 且 发 现 群 在 数学 的 各 种 领域 中 开始 扮演 
中 心 的 角色 . 

在 哈密 尔 顿 、 伽 罗 瓦 和 凯 莱 带 来 代数 学 的 解放 的 同时 ,几何 学 中 则 掀起 了 一 场 更 狐 
烈 的 风暴 ,不 仅 导 致 了 相对 论 的 诞生 ,而 且 深 刻 地 改变 了 人 们 对 宇宙 的 认识 ,这 就 是 高 斯 
等 人 发 现 的 非 欧 几何 . 非 欧 几何 证 明了 “人 类 悟性 的 自由 创造 "有 时 会 具有 一 万 颗 原 子弹 
所 无 法 比拟 的 强大 威力 . 

众所周知 , 欧 几 里 得 (Euclid, 约 公元 前 330 一 前 275 年 ) 在 4 几何 原本 》 中 给 出 了 五 个 
公设 ,其 中 第 五 公设 为 : 阁 一 直线 与 两 直线 相交 , 且 若 同 侧 所 交 两 内 角 之 和 小 于 两 直角 ， 
则 两 直线 延长 后 必 相 交 于 该 侧 的 一 点 . 早 在 公元 前 ,人 们 就 发 现 欧 几 里 得 的 第 五 公设 不 
仅 叙 述 繁琐 , 而且 不 像 其 他 四 个 公设 那样 是 自明 的 .事实 上 ,与 之 等 价 的 "平行 线 公 设 ” 更 
直观 易 懂 : 设 有 一 直线 及 直线 外 一 点 , 则 过 该 点 可 以 做 唯一 的 一 条 直线 与 该 直线 平行 . 按 
齐 民 友 先 生 的 解释 , 欧 几 里 得 之 所 以 采用 这 么 拖 珍 的 表述 语言 ,是 因为 他 想 极力 避免 希 
腊 数 学 家 觉得 可 怕 和 难以 理解 的 无限” 概念. 

有 些 数学 家 还 注意 到 《几何 原本 》 中 只 在 命题 二 十 九 中 使 用 过 第 五 公设 ,因此 人 们 一 
直 怀 疑 第 五 公设 的 独立 性 ,并 尝试 用 其 他 公设 来 证 明 它 . 这 种 努力 延续 了 几 千 年 仍然 没 
有 结果 ,许多 数学 家 为 此 抱 憾 终身 . 直到 19 世纪 初 ,人 们 开始 逐步 意识 到 “第 五 公设 是 
不 可 证 明 的 ”, 因 此 “要 么 承认 平行 线 假设 ,要 人 么 换 一 个 新 的 公设 得 到 一 种 新 的 几何 ”. 
这 种 “新 的 几何 ”就 是 非 欧 几何 . 同时 独立 地 创立 非 欧 几何 的 ,有 小 鲍 耶 (Jinos Bolyai， 
1802 一 1860, 见 图 2-7) . 罗 巴 切 夫 斯 基 (Nikolai Lobachevsky,1792 一 1856, 见 图 2 8) 


图 2-7 小 鲍 耶 (1802 一 1860) 图 2-8 罗 巴 切 夫 斯 基 (1792 一 1856) 
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据说 小 鲍 耶 是 一 位 数学 神童. 他 13 岁 时 已 经 懂得 微 积分 , 曾 代 父 上 课 ,并 获 学 生 好 
评 . 老 鲍 耶 毕 生 致 力 于 第 五 公设 的 证 明 , 但 正如 在 给 儿子 信 中 所 言 :“ 它 熄灭 了 我 一 生 的 
所 有 光明 和 乐趣 . ”因此 当 他 得 知 儿子 也 在 研究 第 五 公设 时 ,当然 极力 劝阻 :“ 求 求 你 ,看 
在 上 帝 的 份 上 ,放弃 它 吧 . 它 像 肉体 的 激情 一 样 让 人 恺 惧 , 因 为 它 也 会 占用 你 全 部 的 时 
间 ,剥夺 你 身体 的 健康 内心 的 平静 和 生活 的 快乐 .” 可 是 小 鲍 耶 对 此 已 经 铁 了 心 , 尽 管 还 
没有 获得 令 自己 满意 的 结果 ,但 在 回信 中 ,他 仍然 察 迈 地 宣布 道 :我 已 从 一 无 所 有 之 中 
创造 了 一 个 新 宇宙 . ”这 个 新 宇宙 就 是 :过 直线 外 一 点 可 以 做 无 数 条 直线 与 已 知 直线 平 
行 . 既然 如 此 , 老 鲍 耶 也 就 不 再 为 难 儿 子 ,反而 督促 小 鲍 耶 立刻 发 表 这 个 成 果 , 因 为 “许多 
东西 似乎 都 有 一 个 时 机 ,时 机 一 到 就 会 在 几 个 不 同 的 地 方 被 发 现 ,好 像 春 天 的 紫罗兰 处 
处 开放 一 样 ” 经 过 多 年 研究 ,1832 年 ,小 鲍 耶 以 “空间 的 绝对 科学 ”为 题 ,将 自己 的 研究 成 
果 以 附录 的 形式 发 表 在 父亲 的 一 本 书 中 . 老 鲍 耶 连忙 把 此 书 寄 给 自己 在 哥 廷 根 大 学 学 习 
期 间 结 交 的 密友 高 斯 ,希望 得 到 支持 . 回信 很 快 就 来 了 ,在 信 中 ,高 斯 写 道 :“ 您 的 儿子 采 
用 的 途径 和 得 到 的 结果 ,几乎 和 我 自己 的 沉思 完全 一 样 . 这 思想 蒙 绕 于 我 心 已 有 30 到 35 
年 了 (高 斯 时 年 55 岁 ). "小 鲍 耶 深 受 打击 , 自 此 后 拒绝 发 表 自 己 的 研究 成 果 . 

“春天 的 紫罗兰 ”也 绽放 在 当时 的 俄罗斯 . 几乎 与 小 鲍 耶 同时 , 喀 山 大 学 的 罗 巴 切 夫 
斯 基于 1826 年 在 学 校 宣读 了 一 篇 论文 ,阐述 了 他 的 几何 思想 . 3 年 后 ,他 在 《 喀 山 学 报 》 上 
发 表 “ 论 几何 学 原理 ”一 文 ,正式 宣布 第 五 公设 是 不 可 证 明 的 ,并 提出 了 一 个 新 的 公设 :过 
直线 外 一 点 可 以 有 一 条 以 上 的 直线 不 与 已 知 直 线 相交 . 采用 这 个 新 公设 , 罗 巴 切 夫 斯 基 
推导 出 了 一 种 新 几何 . 尽管 新 几何 中 没有 任何 内 在 的 逻辑 矛盾 ,但 它 看 上 去 与 常识 完全 
背道而驰 ,其 至 连 罗 巴 切 夫 斯 基 自 己 也 称 之 为 “ 虚 几 何 学 ”. 1832 年 ,根据 罗 巴 切 夫 斯 基 
的 请 求 ,该 文 被 呈送 给 彼得 堡 科 学 院 审 评 . 负责 评定 的 是 新 当选 的 院士 奥 斯 特 风格 拉 
次 基 (IMikhail Ostrogradski,1801 一 1862). 尽管 在 数学 物理 、 数 学 分 析 、 力 学 和 天 体力 学 
等 方面 有 着 卓越 的 成 就 ,但 这 位 新 院士 不 仅 没 能 理解 罗 巴 切 夫 斯 基 的 新 几何 学 思想 ， 
还 使 用 极其 挖 蔡 的 语言 ,对 罗 巴 切 夫 斯 基 作 了 公开 的 指责 和 攻击 . 在 提交 给 科学 院 的 
鉴定 书 一 开 基 ,他 就 以 嘲弄 的 口吻 写 道 :“ 看 来 ,作者 旨 在 写 出 一 部 使 人 不 能 理解 的 著 
作 . 他 达到 了 自己 的 目的 . ”最 后 他 粗暴 地 断言 :“ 这 部 著作 雇 误 连篇 ,因而 不 值得 科学 
院 的 注意 .” 

尽管 没有 获得 理解 和 支持 , 罗 巴 切 夫 斯 基 完 全 清楚 这 种 新 几何 所 具有 的 重要 意义 ， 
因而 坚持 “一 个 人 的 战争 ”. 他 先后 撰写 了 三 部 专著 ,详尽 地 介绍 和 推广 这 种 新 几何 ,其 中 
1840 年 以 德 文 出 版 的 《平行 线 理论 的 几何 研究 ) 一 书 ,受到 了 高 斯 的 注意 . 在 高 斯 的 推荐 
下 , 罗 巴 切 夫 斯 基 被 选 为 哥 廷 根 科学 院 院 士 . 然而 在 公开 的 出 版 物 中 ,高 斯 从 未 对 罗 巴 切 
夫 斯 基 的 工作 给 予 支持 . 这 也 使 得 人 们 对 新 几何 学 的 了 解 十 分 缓慢 . 罗 巴 切 夫 斯 基 , 这 位 
非 欧 几何 的 拓荒 者 ,不 得 不 在 与 世 隔绝 的 孤独 中 踊 踊 前 行 ,直至 1856 年 逝世 . 到 了 1868 
年 ,贝尔 特 拉 米 (Eugenio Beltrami,1835 一 1900) 考 察 了 伪 球 面 , 即 电 物 线 绕 其 渐 近 线 旋 
转 而 形成 的 回转 曲面 ,给 出 了 罗 巴 切 夫 斯 基 和 小 鲍 耶 的 非 欧 几 何 的 一 个 具体 实现 . 直到 
这 时 ,长 期 无 人 问津 的 非 欧 几 何 才 开始 获得 学 术 界 的 普遍 注意 和 深入 研究 , 罗 巴 切 夫 斯 
基 的 独创 性 研究 也 由 此 得 到 学 术 界 的 高 度 评 价 和 一 致 赞美 ,他 本 人 也 被 人 们 赞誉 为 “ 几 
何 学 中 的 哥 白 尼 ” 

伟大 的 高 斯 为 何不 敢 公开 支持 非 欧 几何 呢 ? 这 是 因为 当时 占据 统治 地 位 的 是 德国 古 
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明哲 学 的 芮 基 人 康德 (Immanuel Kant, 见 图 2- 9) 的 时 空 观 . 

在 康德 之 前 的 时 代 , 哲 学 家 们 围绕 着 科学 知识 的 “确证 性 
问题 ”, 即 作为 真理 的 科学 知识 具有 何 种 特征 ,展开 了 激烈 的 
争论 ,这 在 哲学 史上 被 称 之 为 “认识论 转向 ”当时 占据 主流 地 
位 的 哲学 思想 为 英国 经 验 主义 和 大 陆 理 性 主义 . 英国 经 验 主 
义 的 代表 人 物 为 培根 (Francis Bacon, 1561 一 1626)、 洛 克 
(John Locke,1632 一 1704)、 贝克 莱 (George Berkeley,1685 一 
1753) 和 休 议 (David Hume,1711 一 1776). 他 们 认为 知识 只 能 
来 源 于 感觉 经 验 , 所 谓 的 科学 (在 当时 的 语 境 下 特 指 实 验 科 
学 ) ,就 是 对 感觉 经 验 的 归纳 , 因此 他 们 思考 的 焦点 主要 集中 
在 从 经 验 中 得 到 的 感觉 材料 是 如 何 构 成 知识 的 . 他 们 的 模式 
可 以 表述 为 “经 验 一 观念 一 知识 ”, 即 以 经 验 来 说 明 观 念 , 以 观 

图 2-9 康德 724 一 1804) 念 的 组 合 或 分 解 来 说 明知 识 的 . 经 验 主义 的 局 限 就 在 于 它 既 
无 法 说 明知 识 的 客观 可 靠 性 ,也 无 法 说 明知 识 的 普遍 必然 性 ,这 使 得 后 来 的 经 验 主 义 者 
在 发 展 该 理论 时 必然 得 出 怀疑 主义 和 不 可 知 论 的 结论 . 

大 陆 理性 主义 的 代表 人 物 则 是 笛 卡 尔 . 斯 宾 诺 莎 (Baruch Spinoza，1632 一 1677) 、 莱 
布 尼 蒋 (Gottfried von Leibniz,1646 一 1716) ,等 等 . 他 们 认为 感觉 经 验 是 相对 的 、 个 别 的 、 
偶然 的 ,因而 是 不 可 靠 的 ,具有 普遍 必然 性 的 科学 知识 不 可 能 建立 在 感觉 经 验 的 基础 之 上 . 
如 果 科 学 知识 是 存在 的 , 它 必 人 然 只 能 是 从 理性 所 固有 的 天 赋 观 念 中 推演 而 来 , 唯 其 如 此 , 科 
学 知识 才能 具有 普遍 必然 性 . 第 卡尔 首先 要 求 以 观念 的 “直观 ”作为 真理 性 认识 的 标准 ,并 
且 以 数学 特别 是 欧 氏 几何 作为 一 切 可 靠 知 识 的 标本 ,认为 只 有 像 几 何 学 那样 从 极 少 几 条 
完全 清楚 明白 的 “自明 ”公理 出 发 ,依靠 人 的 “自然 灵 明 ”, 即 天 赋 的 理性 认识 能 力 ,来 进行 每 
一 步骤 都 清楚 明白 ,准确 无 误 的 推理 ,这 样 得 来 的 知识 才 是 可 靠 的 . 应 当 注 意 的 是 , 笛 卡 尔 的 
“直观 ”不 是 感性 的 直观 , 即 用 眼睛 “看 ”, 而 是 理性 的 直观 , 即 用 心灵 “看 ”, 因 此 其 对 象 不 是 客 
观 的 现实 世界 ,而 是 主观 的 概念 世界 ,这 样 的 直观 知识 既是 主观 的 ,又 是 先天 的 . 

大 陆 理性 主义 认为 一 切 外 在 对 象 都 必须 服从 因果 决定 论 , 这 实际 上 是 把 物理 学 的 机 
械 思维 应 用 于 整个 自然 和 社会 的 表现 . 这 样 一 来 ,理性 主义 者 和 经 验 主义 者 一 样 ,都 将 知 
识 封 锁 在 思 的 领域 内 了 . 试想 :如 果 知 识 纯粹 是 靠 还 辑 由 理性 演绎 出 来 而 与 经 验 无 关 , 那 
它 怎么 可 能 和 外 部 对 象 一致 呢 ? 

正 是 看 到 了 经 验 主 义 与 理性 主义 各 自 的 片面 性 ,康德 力图 将 两 者 调和 起 来 ,从 而 给 
近代 哲学 带 来 了 一 场 " 哥 白 尼 革 命 ” 在 《纯粹 理性 批判 》 一 书 中 ,康德 试图 通过 “ 先 验 哲 
学 ”或 者 说 通过 回答 “先天 综合 判断 何以 可 能 ”来 解决 知识 的 确证 性 问题 . 他 提出 了 “先天 
综合 判断 ”的 概念 ,认为 知识 的 确证 性 在 于 先天 综合 判断 ,或 者 说 先天 综合 判断 使 知识 成 
为 可 能 . 先天 综合 判断 一 方面 是 一 种 “先天 ”的 “直观 形式 ”, 具 有 理性 主义 者 "天赋 ” 的 色 
彩 ; 另 一 方面 又 是 后 天 感觉 经 验 的 一 种 "综合 判断 ” 康德 的 “综合 判断 ”是 与 "分析 判断 ” 
相对 的 概念 :前 者 是 “扩展 性 的 ,对 已 有 的 知识 有 所 增加 ;后 者 则 是 “解释 性 的 ,丝毫 没 
有 增加 知识 的 内 容 . 为 了 解释 经 验 的 合理 性 ,他 又 将 “综合 判断 ”划分 为 先天 综合 判断 和 
后 天 综合 判断 ,后 者 来自 经 验 ”, 前 者 则 “来 自 纯粹 理智 和 纯粹 理性 ”. 康德 认为 ,数学 判 
断 不 仅 是 综合 判断 ,更 是 先天 的 综合 判断 . 问题 是 :为 什么 数学 判断 是 先天 的 呢 ? 康德 将 
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之 归结 为 : 纯 数学 何以 可 能 ? 然后 他 通过 提出 * 先 验 感性 论 ” ,回答 了 这 个 问题 . 

康德 认为 ,人 类 的 认识 经 历 三 个 阶段 :感性 一 知性 一 理性 . 他 将 感性 定义 为 "通过 被 
对 象 作 用 的 方式 而 接受 表象 的 能 力 ”, 即 感性 是 人 接受 对 象 表 象 的 能 力 . 他 把 刺激 感官 的 
对 象 称 为 物 自体 ,把 感官 接受 的 表象 称 为 感性 直观 ,而 把 感性 对 物 自 体 的 刺激 做 出 的 反 
应 称 为 直观 形式 . 他 进一步 将 感性 直观 分 为 质料 和 形式 两 部 分 :前 者 是 被 给 予 的 感性 材 
料 ,是 后 天 的 、 经 验 的 感性 直观 ;后 者 则 是 先 于 感觉 而 存在 的 ,是 一 种 先天 的 、 纯 粹 的 感性 
直观 ,他 称 之 为 感性 纯 直观 . 感性 纯 直 观 是 接受 并 整理 杂 多 现象 的 先天 框架 或 模式 ,“ 这 
样 的 (感性 纯 ) 直观 就 是 空间 和 时 间 ” 他 通过 论证 ,进一步 指出 :空间 是 几何 研究 的 对 象 ， 
空间 的 纯 直 观 性 质 使 得 几何 学 的 先天 综合 判断 成 为 可 能 . 同 理 , 时 间 是 代数 研究 的 对 象 ， 
时 间 的 纯 直观 性 质 使 得 代数 学 的 先天 综合 判断 成 为 可 能 . 康德 的 论点 其 实 来 自 欧 氏 几 
何 ,他 想 说 明 欧 氏 几 何 的 普遍 真理 性 ,就 将 之 视 为 人 生 而 具有 的 先天 框架 或 模式 ,因此 不 
使 用 欧 氏 几何 就 不 能 感知 世界 . 

早 在 1824 年 给 朋友 的 信 中 ,高 斯 就 指出 :假使 三 角形 的 内 角 和 小 于 180 会 得 到 一 种 奇 
异 的 几何 ,和 我 们 的 ( 欧 几 里 得 ) 几 何 大 不 相同 ,然而 又 是 彻底 相 容 的 . 我 已 经 把 它 发 展 到 自 
己 完全 满意 的 程度 ,我 可 以 解决 其 中 一 切 问 题 ,但 有 一 个 常数 无 法 确定 ,而 它 是 不 能 先 验 地 
决定 的 . "可 是 ,按照 康德 的 理论 ,根本 不 可 能 有 非 欧 几何 . 正 是 顾忌 到 “ 比 奥 西 亚 人 了 ?的 喧 
器 ”, 从 而 担心 “被 卷 进 任何 玄学 争论 ”, 高 斯 迟 迟 没 有 发 表 自 己 的 成 果 , 也 没有 公开 支持 小 鲍 
耶 和 罗 巴 切 夫 斯 基 的 工作 . 当然 ,对 完美 的 追求 也 是 其 缘由 之 一 ,因为 高 斯 坚信 “宁可 发 表 
少 ,但 发 表 的 东西 (必须 ) 是 成 熟 的 . ”这 使 得 他 与 许多 人 在 优先 权 上 存在 争议 ,比如 与 勒 
让 德 (Adrien-Marie Legendre,1752 一 1833) 在 最 小 二 乘法 的 优先 权 上 就 存在 争议 . 

有 意思 的 是 ,尽管 高 斯 带 来 了 这 么 伟大 的 发 现 ,德国 马克 的 设计 者 却 选择 了 正 态 分 
布 作为 高 斯 的 代表 性 成 果 ( 见 图 2 - 10) ,因为 高 斯 在 1809 年 出 版 的 论著 《天 体 运 动 理论 》 
末尾 ,以 极其 简单 的 手法 导出 了 误差 分 布 一 一 正 态 分 布 ,并 用 最 小 二 乘法 加 以 验证 . 因 
此 , 正 态 分 布 又 被 称 为 高 斯 分 布 . 当然 关于 正 态 分 布 是 否 是 高 斯 最 先 发 现 的 ,也 有 争议 . 
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图 2- 10 德国 货币 中 的 高 斯 与 正 态 分 布 图 2- 11 黎 曼 (1826 一 1866) 
到 了 1854 年 ,高 斯 或 许 意识 到 大 限 将 至 (次 年 他 就 在 睡梦 中 汗 然 长 逝 ) ,一 向 谨慎 的 
他 终于 带 着 少 有 的 热情 ,在 同事 面前 对 另 一 位 天 才 的 工作 大 加 赞赏 . 完全 当 得 起 他 的 赞 
赏 的 ,就 是 他 的 学 生 黎 曼 (Bernhard Riemann, 见 图 2- 11). 在 哥 廷 根 大 学 的 就 职 仪式 上 ， 


@ 十 希 腊 雅 典 以 东 地 区 的 人 ,被 视 为 思春 . 矫 饰 而 无 真知 . 这 里 指 康德 学 派 的 门徒 . 
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按照 惯例 , 黎 曼 宣讲 了 一 篇 名 为 “关于 几何 基础 的 假设 ”的 授课 资格 论文 . 这 应 该 是 数学 
史上 最 著名 的 一 次 试 讲 , 因 为 黎 曼 在 该 文中 ,用 最 通俗 的 语言 对 整个 几何 学 做 了 一 次 深 
刻 而 闵 阔 的 概览 , 俯 梧 了 当时 已 陷 人 杂乱 无 章 中 的 几何 学 ,从 而 给 出 了 几何 学 的 一 种 全 
新 定义 , 即 几何 学 是 关于 流 形 的 一 门 科 学 . 

流 形 指 的 是 带 有 坐标 系 及 定义 了 两 点 之 间 最 短 距 离 的 度量 公式 的 空间 ,或 者 说 是 局 
部 具有 欧 氏 空间 性 质 的 空间 . 以 三 维 欧 几 里 得 几何 为 例 , 作 为 特殊 的 三 维 流 形 , 其 度量 公 
式 在 无 穷 小 意义 下 可 表示 为 

ds 一 dz 十 dy 十 dx 


对 黎 曼 而 言 ,几何 本 质 上 就 是 由 一 个 n 维 有 序数 组 (zi ,x2,…,x, ) 的 集合 与 定义 在 
该 集合 上 的 特定 的 规则 组 成 的 ,这 个 规则 就 是 他 的 假设 :曲线 上 无 穷 小 距离 元 素 ds 可 表 
示 为 dz; 的 齐 次 正定 二 次 函数 的 平方 , 即 


ds’ = 》， 要 4 dzidzi 


其 中 ,8 为 流 形 上 的 连续 函数 ,并 且 sy 一 8 

由 于 黎 曼 的 论文 中 充斥 着 一 大 堆 陌 生 概念 ,竟然 使 得 当时 被 誉 为 世界 数学 中 心 的 哥 
廷 根 大 学 的 全 体 教员 个 个 眼花 综 乱 ,因此 尽管 有 高 斯 的 称赞 ,但 该 文中 的 新 思想 几乎 没 
在 其 他 场合 发 生 作 用 ,直到 和 歼 曼 因 长 期 的 清贫 、 过 度 的 操劳 和 发 奋 的 研究 而 英 年 早 逝 后 
的 第 3 年 ( 即 1868 年 ) ,该 文才 被 整理 出 版 并 引起 更 多 学 者 的 注意 . 尤其 值得 一 提 的 是 赫 
姆 堆 尔 效 CHermann von Helmholtz,1821 一 1894) 和 克利 福 德 (William Clifford, 1845 一 
1879) 等 人 的 解释 和 扩充 ,使 得 黎 曼 的 流 形 理论 成 为 重要 的 物理 研究 工具 ,并 在 之 后 的 相 
对 论 变革 中 牢 牢 占据 着 中 心地 位 

4 年 后 的 1872 年 ,F. 克 莱 因 (Felix Kline, 见 图 
2-12) 就 任 埃 尔 朗 根 大 学 教授 ,在 就 职 演讲 中 ,他 发 表 
了 “关于 近代 几何 研究 的 比较 考察 ”( 史 称 * 挨 尔 朗 根 纲 
领 ”) 的 论文 . 在 文中 ,他 提出 几何 学 就 是 研究 在 流 形 中 ， 
那些 在 某 个 特定 的 变换 群 作用 下 保存 不 变 的 图 形 特性 ， 
按 他 自己 的 话说 ,就 是 “给 定 一 个 流 形 及 其 上 的 一 个 变 
换 群 ,研究 流 形 的 构 形 中 那些 在 该 变换 群 下 不 会 改变 的 
特性 ”例如 , 欧 氏 平面 几何 所 研究 的 ,就 是 在 由 平面 上 
的 平移 和 旋转 组 成 的 变换 群 作 用 下 ,依然 保持 不 变 的 图 
ee 及 形 属性 (面积 和 长 度 等 ). 按照 这 一 观点 ,对 变换 群 的 任 

9 195) 何 一 种 分 类 都 成 了 几何 学 的 一 种 规范 化 . 换言之 ,有 多 

少 种 不 同 的 变换 群 ,就 有 多 少 种 不 同 的 几何 学 . 同样 令 人 遗憾 的 是 ,该 文 直到 大 约 20 年 
后 被 译 成 意大利 文 、 法 文 和 英文 后 , 才 受 到 关注 . 从 那 以 后 , 克 莱 因 的 变换 群 不 变量 思想 
成 为 各 类 几何 的 重要 研究 对 象 ,并 为 群 的 抽象 概念 的 发 展 提供 了 原动力 . 克 莱 因 本 人 也 
在 晚年 扮演 着 数学 领域 “元 老 ” 的 角色 ,他 从 1886 年 起 开始 就 职 的 哥 廷 根 大 学 也 成 了 学 
子 们 心中 的 “圣地 ”. 

到 了 19 世纪末, 出 现 了 为 各 种 类 型 的 数学 结构 构造 的 公理 体系 ,例如 群 和 域 ,以 


。 70。 矩阵 分 析 与 计算 


及 正 整 数 集 . 1899 年 希 尔 伯 特 (David Hilbert, 见 图 
2-13) 发 表 的 《几何 基础 ;一 书 , 不 仅 给 出 了 欧 氏 几何 
的 一 个 形式 公理 系统 ,而 且 解 决 了 公理 化 方法 的 一 系 
列 逻 辑 理论 问题 ,成 为 形式 公理 学 的 葛 基 著作 . 自从 该 
书 问世 以 后 ,不 仅 公 理化 方法 进入 了 数学 的 其 他 各 个 
分 支 ,而 且 也 把 公理 化 方法 本 身 推 向 了 形式 化 的 阶段 . 

在 《几何 基础 ?中 ,和希 尔 伯 特 从 3 个 未 定义 的 对 象 
(点 .直线 和 平面 ) 和 6 种 未 定义 的 关系 (在 上 面 \ 在 里 
面 \ 在 之 间 、 全 等 .平行 和 连续 ) 入 手 ,并 借助 于 5 组 共 
20 个 公理 (被 称 为 希 尔 伯 特 公理 ) 来 定义 它们 之 间 的 相 。” 图 2- 1 希 尔 伯 特 (1862 一 1943) 
互 关系 . 希 尔 伯 特 特别 指出 ,在 证 明 结论 中 不 应 该 使 用 
几何 直觉 ,因此 他 甚至 幽默 地 建议 用 椅子 .桌子 和 啤酒 杯 来 蔚 代 点 直线 和 平面 ,只 要 它 
们 满足 公理 . 

在 论述 完 这 些 公理 之 后 , 希 尔 伯 特 进而 指出 它们 都 是 相 容 的 , 即 从 其 中 不 会 推导 出 
任何 矛盾 . 这 后 来 被 总 结 为 一 个 公理 系统 要 具有 相 容 性 , 即 在 一 个 公理 系统 中 ,不 允许 同 
时 能 证 明 某 一 定理 及 其 否定 理 . 这 实际 上 是 一 个 基本 要 求 ,任何 学 科 和 理论 体系 都 必须 
满足 . 一 个 公理 系统 还 必须 具备 另 一 个 重要 特征 , 即 独立 性 , 它 要 求 在 一 个 公理 系统 中 的 
每 一 条 公理 都 独立 存在 ,不 允许 有 一 条 公理 能 用 其 他 公理 把 它 推导 出 来 ,同时 ,公理 的 数 
目 必 须 减 少 到 最 低 限 度 . 虽然 希 尔 伯 特 没 有 完整 地 证 明 独 立 性 ,但 他 确实 指出 了 不 同 组 
的 公理 之 间 的 独立 性 . 不 过 和 希 尔 伯 特 没 有 论述 到 公理 系统 最 深层 次 的 特性 , 即 完备 性 , 尽 
管 他 相信 自己 的 系统 是 完备 的 . 好 在 《几何 基础 ) 出 版 没 多 久 , 就 有 好 几 位 数学 家 指出 , 希 
尔 伯 特 公理 可 以 证 明 欧 氏 几 何 的 所 有 定理 . 

这 种 公理 化 浪潮 自然 也 会 波及 到 线性 代数 中 . 实际 
上 , 随 着 1862 年 格拉 斯 曼 的 《线性 扩张 论 》( 修 订 版 ) 的 面 
世 , 在 1870 一 1890 年 间 ,与 格拉 斯 曼 系统 有 关 的 文章 开始 
增多 ,因此 我 们 可 以 说 线性 代数 的 公理 化 之 路 甚至 比 希 尔 
伯 特 的 4 几何 基础 》 还 要 早 10 年 光景 . 给 出 线性 代数 最 早 的 
公理 化 表述 的 数学 家 中 ,最 著名 的 是 皮 亚 诺 (Giuseppe Peano， 
见 图 2- 14). 在 1888 年 出 版 的 《几何 演算 ) 一 书 中 ,他 陈述 
了 格拉 斯 曼 理论 的 基本 内 容 . 尽管 皮 亚 诺 的 表述 已 经 比 
格拉 斯 曼 的 要 清晰 得 多 ,但 由 于 他 仅仅 局 限于 几何 学 方 
面 ,这 使 得 他 的 著作 隐藏 了 格拉 斯 曼 原著 中 的 一 般 性 . 但 
令 人 惊讶 的 是 ,在 该 书 的 最 后 一 章 , 皮 亚 诺 给 出 了 被 他 称 
为 “线性 系统 ”的 一 个 公理 化 定义 ,也 就 是 如 今 的 向 量 空间 的 第 一 个 公理 化 定义 : 

72. 存在 这 样 的 实体 系统 ,对 它 我 们 给 出 以 下 的 定义 : 

1. 系统 中 两 个 实体 a 和 b 相等 是 这 样 定 义 的 :这 意味 着 定义 了 一 个 可 以 写 为 a 二 b 
的 命题 , 它 表示 系统 中 两 个 实体 之 间 存 在 的 一 种 条 件 , 这 种 条 件 只 被 一 些 实体 对 满足 的 ， 
而 其 他 的 实体 对 并 不 满足 ,而 且 满 足以 下 逻辑 方程 : 


图 2- 14 皮 亚 诺 (1858 一 1932) 
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(a=b)=(b=a),(a=b) (| (b=ce)<(a=ce)o 
2. 两 个 实体 的 和 a 十 b 是 这 样 定 义 的 :这 表示 ,存在 一 个 被 写成 a 十 b 的 实体 , 它 也 属 
于 这 个 系统 ,而 且 满 足下 列 条 件 : 
(a 王 四 <(a 十 cb 十 c) ,a 十 2 一 0 十 aa 十 (十 ec) 一 (aa 十 四) 十 c 


其 中 ,最 后 一 个 等 式 两 端的 共同 值 可 以 写成 a 十 b 十 c. 
3. 令 @ 是 系统 中 的 一 个 实体 ,ma 是 一 个 正 整数 ,我 们 用 表达 式 ma 来 表示 m 个 等 于 
a 的 实体 的 和 . 显而易见 ,给 定 系统 中 的 实体 Q,D… 以 及 正 整数 7,72,…，, 有 : 


(a=b)<mb=mb) ;matb)=matmb; (mina=matna;m(na)= mn)a;la=a 


我 们 假定 对 于 任何 的 实数 m, 表 达 式 ma 的 意义 被 给 定 , 这 样 之 前 的 方程 仍然 成 立 . 
实体 ma 可 以 被 称 作 ( 实 ) 数 m 和 实体 a 的 积 . 
4. 最 后 我 们 假定 系统 中 存在 这 样 一 个 实体 ;我 们 称 之 为 零 实体 ,并 用 0 来 表示 . 那 
么 ,对 于 任意 实体 qa, 数 0 和 4a 的 积 将 永远 是 0, 或 者 04a 二 0. 
如 若 我 们 指定 表达 式 a 一 b 的 含义 为 a 十 (一 1)b, 则 成 立 : 
4 一 0 二 0;a 十 0 王 Q 


定义 ”如 果 一 个 实体 系统 中 满足 限定 条 件 的 定义 1,2,3,4 都 已 给 出 , 则 称 这 样 的 系 

皮 亚 诺 专著 的 组 织 结构 有 些 令 人 惊讶 ;无 论 是 第 一 章 ( 通 过 引信 大 量 新 术语 ,讲述 了 
演绎 逻辑 的 基础 ) 还 是 最 后 一 章 , 看 起 来 与 专著 的 其 他 部 分 毫 无 关联 .事实 上 , 皮 亚 诺 的 
公理 化 定义 是 他 阅读 格拉 斯 曼 的 结果 ,也 是 他 自己 的 思考 以 及 关于 逻辑 和 形式 化 的 工作 
的 结果 . 在 这 个 意义 上 , 相 比 解 决 新 间 题 的 可 能 性 ,很 明显 , 皮 亚 诺 更 关心 数学 基础 这 个 
理论 问题 . 遗憾 的 是 ,尽管 皮 亚 诺 在 某 种 程度 上 成 功 地 在 意大利 推广 了 格拉 斯 曼 的 某 些 
结果 ,但 是 他 的 公理 化 方法 没有 被 立即 接受 . 我 们 就 这 样 与 向 量 空间 的 公理 化 表述 擦 户 
而 过 ,直到 40 年 之 后 . 

10 年 后 的 1898 年 , 皮 亚 诺 给 出 了 向 量 空间 的 第 2 个 公理 化 系统 . 他 陈述 了 11 个 公 
理 ,其 中 关于 向 量 w 和 vw 的 内 积 (他 记 之 为 ulv) 的 4 个 公理 (ulv 是 一 个 实数 ;xjly 一 "| us 
(uyV) iw 二 wu| w 二 vw; 如 果 w 隆 0, 则 wlu 是 一 个 正 实数 ) ,后 来 成 为 标准 公理 . 历史 再 次 
让 我 们 无 语 ,因为 当时 除了 罗素 (Bertrand Russel,1872 一 1970) 以 外 ,这 个 系统 对 其 他 数 
学 家 几乎 没有 产生 任何 影响 . 究 其 原因 ,或 许 是 当时 的 公理 化 方法 尚 处 幼年 ,而 且 当 时 的 
公理 化 与 几何 的 联系 是 如 此 紧密 ,以 至 于 人 们 丝毫 不 理会 线性 代数 等 其 他 重要 领域 的 
思想 . 

另 一 个 在 线性 代数 中 采用 公理 化 方法 的 先驱 是 外 尔 (Hermann Weyl,1885 一 1955)， 
1918 年 ,他 在 4 空间, 时间 ,物质 ;一 书 中 ,对 实数 域 上 的 有 限 维 向 量 空间 进行 了 公理 化 . 在 
书 中 ,除了 在 脚注 中 提 到 格拉 斯 曼 1844 年 版 的 《线性 扩张 论 ) 之 外 ,他 看 来 对 皮 亚 诺 的 工 
作 一 无 所 知 . 当然 ,很 多 人 对 他 的 著作 也 一 无 所 知 ,因此 比 起 皮 亚 诺 来 ,他 的 影响 甚至 更 


@ 皮 亚 诺 用 符号 "二 "来 表示 相等 的 关系 ,用 “二 ”表示 一 种 包含 关系 ,“ 门 ”表示 连接 词 “ 且 ”. 
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小 . 另外 ,他 在 该 书 第 一 章 中 给 出 的 定义 ,是 以 " 仿 射 几 何 的 基础 ?为 标题 的 ,这 显然 已 经 
偏离 了 皮 亚 诺 给 出 的 现代 定义 . 

最 终 让 大 家 普遍 接受 向 量 空间 的 抽象 观念 的 ,是 巴 拿 赫 (Stefan Banach, 1892 一 
1945) ,哈恩 (Hans Hahn,1879 一 1934) 和 维 纳 (Norbert Wiener,1894 一 1964) 等 泛 函 分 析 
学 家 ,他 们 分 别 独立 地 给 出 了 完备 赋 范 向 量 空 间 的 公理 化 定义 ,其 中 巴 拿 赫 的 影响 力 最 
大 ,因此 完备 赋 范 向 量 空间 又 被 称 为 巴 拿 赫 空间 . 

巴 拿 赫 因 第 一 次 世界 大 战 中 断 了 学 业 , 但 战 后 他 仍 不 断 钻研 数学 , 靠 自 学 和 同 数学 
家 交谈 获得 许多 数学 知识 . 1920 年 ,未 经 大 学 正规 训练 的 巴 拿 赫 被 破格 聘用 为 助教 . 同年 
他 完成 博士 论文 “关于 抽象 集合 上 的 运算 及 其 在 积分 方程 上 的 应 用 ”, 并 在 两 年 后 在 法 国 
出 版 了 该 文 的 部 分 内 容 . 在 简介 中 ,他 写 道 :“ 这 本 书 所 要 达到 的 目标 是 建立 一 些 定理 , 它 
们 对 于 各 种 泛 函 领域 都 是 有 效 的 …… 在 一 般 情况 下 ,我 考虑 的 是 这 样 的 元 素 集 ,我 假定 
它们 具有 某 些 性 质 ,并 由 此 推导 出 一 些 定理 , 然后 我 证 明 所 选用 的 假定 对 于 每 一 个 特定 
的 泛 函 领域 是 成 立 的 . ”这 段 话 表明 , 巴 拿 赫 明显 地 是 在 寻求 一 种 公理 化 方法 ,这 对 当时 
的 分 析 领 域 还 是 很 新 里 的 ,虽然 在 当时 的 波兰 数学 家 中 ( 巴 拿 赫 是 波兰 人 ) 这 种 态度 非常 
流行 . 

在 他 的 完备 赋 范 问 量 空间 的 公理 化 定义 中 , 巴 拿 赫 将 所 有 公理 划分 为 三 部 分 ,虽然 
他 没有 对 相应 的 代数 结构 加 以 命名 . 在 列 出 公理 集 第 一 部 分 的 13 个 公理 之 后 , 巴 拿 赫 给 
出 了 几 个 例子 :几何 ) 向 量 集 , 格 拉 斯 曼 型 ,复数 集 和 四 元 数 集 ， 因此 尽管 他 没有 提 及 向 
量 空间 之 前 的 任何 公理 化 定义 ,但 是 他 选择 的 公理 却 与 向 量 空间 的 现代 定义 非常 接近 ， 
因为 他 列 出 的 实际 上 就 是 向 量 空间 的 8 条 运算 律 和 5 条 性 质 ， 再 次 让 我 们 遗憾 的 是 ,他 
的 论文 当时 影响 有 限 . 

修 忽 又 是 十 年 ,到 了 1932 年 , 巴 拿 赫 的 名 著 《 线 性 算 子 论 ) 刊 行 于 世 . 这 本 书 总 结 
到 那 时 为 止 关 于 赋 范 线性 空间 的 所 有 成 果 , 包 括 线 性 泛 函 延 拓 定理 .共鸣 定理 、 闭 图 像 定 
理 , 让 全 世界 的 分 析 学 家 看 到 了 泛 函 分 析 的 威力 ,成 为 泛 函 分 析 方 面 的 一 部 经 典 之 作 . 

与 此 同时 ,在 代数 学 领域 ,在 1921 年 发 表 的 “ 环 中 的 理想 论 ” 一 文中 “抽象 代数 之 
母 ” 诺 特 (Emmy Noether,1882 一 1935) 引 入 了 模 的 概念 ,并 将 向 量 空间 视 为 模 的 特殊 情 
形 . 1930 一 1931 年 间 , 她 的 学 生 范 德 瓦 尔 登 (Van der Waerden,1903 一 1996) 根 据 她 和 阿 
廷 (Emil Artin,1898 一 1962) 的 演讲 ,编写 了 《 范 氏 大 代数 一 书 , 成 为 抽象 代数 的 代表 作 ， 
被 誉 为 20 上 半 叶 最 重要 的 代数 教科 书 . 在 该 书 中 , 范 德 瓦 尔 登 特 辟 专 章 , 对 线性 代数 给 
予 了 详细 阐述 . 同 诺 特 一 样 ,他 从 环 上 的 模 的 定义 开始 人手 ,直到 下 一 页 , 才 给 出 了 向 量 
空间 的 定义 . 至 此 ,向 量 空间 的 公理 化 定义 才 在 代数 学 中 听 听 坠 地 . 

在 希 尔 伯 特 公理 化 思想 和 《 范 氏 大 代数 》 的 影响 下 , 因 不 满 于 当时 的 数学 教育 ,法 国 
的 年 轻 学 子 组 成 了 布尔 巴 基 学 派 , 该 学 派 仿 照 希 尔 伯 特 、 诺 特 以 及 阿 廷 的 方法 ,将 数学 世 
界 主要 划分 为 三 种 类 型 .代数 结构 ( 群 、 环 、 域 ), 序 结构 ( 偏 序 、 全 序 ) ,拓扑 结构 ( 邻 域 . 连 
续 , 极 限 、 连 通 性 、 维 数 ). 这 三 种 结构 都 是 用 公理 来 确定 的 ,它们 是 母 结构 或 基础 结构 ,其 
中 每 一 种 结构 都 有 许多 分 支 ,而 且 互相 有 一 定 的 关系 . 结构 还 可 以 复合 成 更 复杂 的 结构 ， 
比如 线性 代数 中 的 向 量 空间 . 按 这 种 观点 ,布尔 巴 基 学 派 重 新 建构 了 几乎 整个 现代 数学 ， 
并 深刻 地 影响 了 后 现代 数学 . 如 果 说 抽象 代数 是 “Big Bang”( 宇 宙 诞 生 的 大 爆炸 理论 ) , 那 
么 布尔 巴 基 学 派 的 “结构 数学 ”就 是 连锁 产生 的 更 大 的 “Big Bang”. 
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“结构 数学 ?给 数学 教育 带 来 了 著名 的 “新 数学 运动 由 于 过 分 强调 形式 主义 的 演 

竺 ,忽视 乃至 鄂 视 数学 直观 及 数学 思想 ,“ 新 数学 运动 ”其 至 喊 出 了 “ 欧 几 里 得 深 蛋 ”等 极 
oo 结构 数学 进入 中 小 学 课堂 后 ,也 使 得 数学 成 为 学 生 的 梦 麻 . 在 西方 , 随 着 “新 数学 
运动 ” 的 失败 及 信息 社会 的 冲击 ， 自 1970 年 起 ,年 轻 的 数学 家 开始 走出 布尔 巴 基 学 派 的 
光环 ,投身 于 更 广阔 的 数学 应 用 ,产生 了 分 形 、 混 沌 小 波 、 生 命 游戏 (元 胞 自动 机 )、 孤 立 
子 、 密 码 等 新 的 学 科 . 


2.3 子 空间 的 交 与 和 
ST 表 机 

整体 有 时 太 庞大 ,所 以 我 们 经 常 希望 能 够 “化 整 为 零 , 通 过 部 分 来 获知 整体 ,例如 软 
件 设 计 采 用 的 结构 化 方法 . 对 线性 空间 的 研究 亦 是 如 此 ,我 们 希望 将 一 个 高 维 线性 空间 
分 解 为 多 个 低 维 线性 子 空间 的 和 甚至 直 和 ,并 通过 对 线性 子 空间 的 研究 ,更 加 深刻 地 揭 
示 整 个 线性 空间 的 结构 . 


2.3.1 子 空间 的 交 与 和 


我 们 知道 P 了 Lxj, 是 线性 空间 ,因此 7 一 2,3 时 的 PLz] 、PLzj]s 都 是 线性 空间 ,但 显然 
P[Lzj] CPLxj, 这 说 明 线性 空间 的 子 集 也 可 能 是 线性 空间 . 

定义 2.3.1 设 U 是 线性 空间 V 的 非 空 子 集 . 如 果 U 在 V 中 规定 的 加 法 和 数 乘 运算 
下 构成 线性 空间 , 则 称 U 是 V 的 (线性 ) 子 空间 , 仍 记 为 UV. 

例 2.3.1 显然 R= 二 PLzxji 是 PLxj; 的 子 空间 ,PLxj; 又 是 PLxj; 的 子 空间 …… 即 有 


R 民 一 PLz]CPLzy CC…CPzl,CP[zlC…CP[z] 


判定 非 空 集合 是 否 为 线性 空间 ,也 要 验算 运算 的 封闭 性 以 及 8 条 运算 律 , 那 是 “相当 
地 麻烦 ”. 至 于 判定 线性 空 间 V 的 子 集 U 是 否 为 线性 空间 ,就 比较 方便 了 . 因为 作为 子 
集 ,U 中 自然 保留 了 (A1)、(A2)、(M1)、(M2), 以 及 (D1)、(D2), 剩 下 的 要 求 就 是 “两 种 
运算 封闭 ”以 及 (A3)、(A4). 如 果 对 数 乘 运 算 封闭 ,只 要 分 别 令 & = 二 0, 一 1, 就 得 到 了 
(A3)、(A4). 这 样 ,要 想 将 U 打造 成 “二 八 佳 人 ”, 原 来 如 此 轻松 . 究 其 原因 ,全 赖 “ 美 丽 是 
遗传 的 ”. 

定理 2.3.1 ( 子 空间 判别 法 ) 数 域 F 上 的 线性 空间 V 的 非 空 子 集 U 是 V 的 子 空间 的 
充 要 条 件 是 U 对 V 中 的 运算 都 封闭 , 即 对 任意 w, PE U 和 任意 & EF, 都 有 a 十 BEU 和 
ka EU. 

“两 种 运算 封闭 ”可 以 合并 为 :对 任意 @,B E U 和 任意 AL EF, 都 有 ka 十 lB EU. 

显然 ,线性 空间 V 是 它 自己 的 子 空间 ,而 只 有 零 元 9 的 零 空 间 {6} 是 所 有 线性 空间 
的 子 空间 . 

例 2.3.2 Ci[a,6] 是 CLa,5j 的 子 空间 ,，C?[a,0] 又 是 C[a,6] 的 子 空间 …… 
即 有 


C*[ab] Ce TC Casd]) SC Cilasd] TS CHasb] = Cla 
例 2.3.3 SR” 是 RR” 的 子 空间 , SSR” 也 是 R” 的 子 空间 . 
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例 2.3.4 对 任意 A E RR”, 显然 可 知 N(4) 是 R" 的 子 空 间 , 而 R(4) 是 R” 的 
子 空间 . 
例 2.3.5 已 知 数 域 Ff 上 的 线性 空间 V, 则 向 量 组 w ,w ,…,@, EV 的 线性 组 合 的 
集合 
W= {x= hohoG 十 … 十 Rs| RPR GE 下) 


是 V 的 一 个 子 空间 , 称 为 由 向 量 组 ol ,az ，……w, 所 张 成 的 子 空间 , 记 为 span(oi ,oz ,…， 
cx,) 或 L(g ,az 0). 注意 向 量 组 xl ,as ,…,a, 不 一 定 是 线性 无 关 的 . 

定理 2.3.2 数 域 了 上 线性 空间 VY 的 两 个 子 空间 VV,Vz 的 交 风门 到 也 是 V 的 子 
空间 . 

线性 空间 V 的 两 个 子 空间 的 并 是 不 是 子 空 间 呢 ?很 遗憾 ,“ 这 回 真 不 是 1!” 例 如 在 R? 

令 7 二 (1,0)',j 二 (0,1), 则 span(2)( 即 xz 轴 ) 和 span(j) ( 即 y 轴 ) 都 是 民 : 的 子 空 
间 , 但 W 二 span(i) U span(j) 显然 不 是 子 空间 ,因为 它 对 加 法 不 封闭 ,比如 i 十 j == 
(1,D'¢W. 

那么 包含 两 个 子 空间 的 最 小 子 空间 是 谁 呢 ? 考 虑 到 它 必须 对 加 法 封闭 ,因此 我 们 需 
要 研究 两 者 的 和 . 

定义 2.3.2 ( 子 空间 的 和 ) 设 和 ,V: 是 数 域 F 上 线性 空间 V 的 两 个 子 空 间 , 则 称 
集合 

{@i 十 oo |oEVwo EYV) 


为 子 空间 Vi 与 V: 的 和 (sum), 记 为 Vi 十 Vi. 

定理 2. 3.3 ” 数 域 了 上 线性 空间 Y 的 两 个 子 空间 Vi,V 的 和 Vi 十 Vs 也 是 V 的 子 空间 . 

证 明 : 因为 任意 om EWwCVYoEyVvCV, 因 此 wow 十 cz EV. 另外 ,由 0 二 0 十 0 可 
知 0€ Vi 十 Vz, 故 V 十 Vz 是 V 的 非 空 子 集 . 

对 任意 oP 多 ViVi 由 定义 ,存在 Ql Pi EV 及 oz ,应 EV:， 使 得 w 一 Cl 十 02， 
PB =P Bp. 由 于 a 二 €E Vi,@: 十 p: €E Vi, 故 


a+hp= (Ci 十 @;) 十 (PB 十 应 ) 三 (Ci 十 户 ) 十 (as 十 应 ) EE Vi 十 Vs。 


对 任意 w € Vi 十 V2 及 任意 & EF, 显然 存在 w €E Vi 及 @; EV ,使 得 wx 一 mi 十 C2. 
由 于 kal E Whos € Vi, 故 ha = k(@i Te) = ko 十 has E Vi 十 Vz. 从 而 六 十 V; 也 
是 V 的 子 空间 . 证 毕 

可 以 验证 , 子 空间 的 交 与 和 满足 交换 律 和 结合 律 . 因此 定理 2. 3. 2 和 定理 2 3. 3 可 
推广 如 下 : 

定理 2.3.4 数 域 了 F 上 线性 空间 Y 的 子 空间 ,VG,…,V,; 的 交 Vi 站 Vi 门 … 败 VV, 
与 和 Vi 趟 Wa 二 十 Us 也 是 V 的 子 空间 . 

从 生成 元 角度 看 ,定理 2. 3. 2 意味 着 将 子 空间 的 生成 元 合并 在 一 起 ,就 成 了 和 空间 
的 生成 元 , 即 如 下 定理 : 

定理 2.3.5 设 Vi,V; 都 是 线性 空间 V 的 子 空间 , 且 


Vi 二 Span(oly oz) V = span(p ,PB,,*….,p,) 


~ 了 
on 
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则 VV 二 Vz = span(@i,@2 ,0 ,Bi ,pb ,*… ,Bp,). 

和 例 2.3.6 已 知 @w = (2515351) 50 = (—l1rls =3,1)Y 及 Bb = (4535 1)"; 
Bb: = (1,5,—3,1)', 并 且 Vi== span(@i,@;), VV 二 span( 忆 , 慌 ). 求 Vi 门 V; 和 Vi 十 V。 
的 基 与 维 数 . 

解 : 设 xE Vi 站 VY; 则 gE Vi 且 @ EVi,; 从 而 可 分 别 令 @ 二 ki@ 十 ko@z 及 a 二 
十 Lp ， 故 ki@i 十 ko@z 十 (一 全 ) 房 十 (一 2) 访 = 0, 这 实际 上 就 是 系数 矩阵 为 4 一 (al ,oz， 
Bi .Pp;)、 未 知 向 量 为 无 二 (ki ,kz, 一 ,一 12)7 的 齐 次 线性 方程 组 Ak 二 0. 由 


2 4 | 1 @ 0 0 
] 1 5 5 QQ G 3 
A= (1,0 ,PB ,pb ) 3 m3 
吉 一 蕊 号 二 3 9 0 1 23 
1 1 | 1 0 0 0 0 
解 得 ki = 0 pz = EA = 一 了 4， 因此 ew = Ri 十 AQ 一 4 *，C2， 这 说 明 C2 为 


由 于 


0= ol 十 ios 十 (一 如 0) 房 十 (一 六) 记 
一 0 mi 十 寺中 十 二 5. 记 十 (一 六 


也 就 是 应 一 0。 Ol + 3 十 二 9 而 on 2 ,Pi 线性 无 关 ， 因此 由 定理 .5 可 知 ， 


Vi 十 Vz 二 span(@ai »Q2 ,Pi ,pb; ) 3 span(@a CC2 Pi ) 
即 CI 02 :Pi 是 Vi 十 Vs 的 一 组 基 ， dim(Vi 卡 玉 。) 一 3. 

注意 到 例 2. 3. 6 中 成 立 dimCw 站 Vi) 十 dim(WVi 十 V2) = dim(Vi) 十 dim(Vs), 这 个 
结果 并 不 是 偶然 和 个 别 的 ,而 是 具有 一 般 性 . 

定理 2. 3. 6  ( 维 数 公式 , 又 称 格拉 斯 曼 公 式 ) 设 Vi ,Vs 是 数 域 玉 上 线性 空间 V 的 两 
个 有 限 维 子 空间 , 则 Vi 门 Vi 与 Vi 十 V; 都 是 有 限 维 的 ,并 且 

dim(Vi M1 V2) TT dim(ViT Vi) = dim(Vi) + dim(V,) 

证 明 : 令 dim(V1) 一 Adim(V2) 二 7,dim(Vi 由 Vo) = m, 由 于 维 数 实质 上 就 是 线性 
空间 的 一 组 基 中 基 向 量 的 个 数 ,因此 我 们 从 基 入 手 . 取 Vi 由 V, 的 一 组 基 mi ,oa ， 
并 分 别 扩充 成 Vi 和 V 的 一 组 基 , 即 有 

Wi == span(@i s02 » "°° ,Om Pp ,及 i ;2 = span(@i 02 AR yz， 7 ) 
所 以 Vi 十 Vs 二 span(@i ,Ca ,On ,Pi :Pp ss Bn Yi ya 了)。 
设 


Aioi TT hn 十 力 记 十 … 十 四 Bow 十 qi 十 十 oayw 一 9 (2.3.1) 
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并 令 0 一 kiQi 十 ARzQs2 Et 二 ka 本 ph, 十 pp 加 加 SS 下 力 - 则 [24 € Wi. 又 由 式 
C2. 3. 7: 知 


= (qi i 十 qzY2 oe my (2 3 2) 


即 c E V;. 因此 @€ Vi NN V2. 从 而 又 可 令 wx 一 Li 十 0202 TT LQ 这 样 ， 人 的 两 种 
表示 相等 , 即 


liQ1 十 [2@2 二 | LQ 《di | g2Y; | 二 
注意 到 CI 22 ,0 "Yi » YY» tt 线性 无 关 , 这 意味 着 


ki AR2 “0. ky», qi d2 … 一 qj 一 0 
代入 式 (2. 3.2), 可 知 & 二 0, 也 就 是 
Q = ki@g kG kan piBit poBs tT pe nb = 0 
再 由 ooz oo 及 ,PB ，… ,BB 线性 无 关 , 可 知 
ki k» se kk, pi p: “0. 2 0 
至 此 已 推 得 
= = png =g = mg,=0 


从 而 向 量 组 Q1 02 ""* ,Om :Pp ,Pp: en or Ye ss Ye 线性 无 关 , 所 以 它 是 Vi 十 V: 
的 一 组 基 , 即 dim(Vi 十 Vi) = 上 十 1 一 m. 证 毕 . 


2.3.2 子 空间 的 直 和 


维 数 公式 告诉 我 们 ,和 空间 的 维 数 不 超 过 各 子 空间 的 维 数 之 和 . 那么 等 号 何 时 成 立 
呢 ? 由 维 数 公式 ,此 时 dim(V' 门 Vs) 三 0， 即 Vi 门 V; = {0}. 
定义 2.3.3 设 ww ,V: 是 数 域 F 上 线性 空间 V 的 两 个 子 空间 ,如 果 


Vi NV: 10)} 


则 称 和 Vi 十 Vs 为 直 和 (direct sum) , 记 为 由 也 

定理 2.3.7 设 V,V; 是 数 域 F 上 线性 空间 V 的 两 个 子 空 间 , 则 下 列 命题 是 等 价 的 : 

(1) 和 Vi 十 Vs 是 直 和 ; 

(2) dim(Vi + V;) = dim(Vi) + dim(V;); 

(3) 和 Vi 十 Vs 中 零 元 6 的 表示 法 唯一 , 即 若 有 @&i 十 oo 二 0, 其 中 mm Emo € V;， 
则 必 有 @& 二 oz 一 0; 

(4) 和 Vi 十 Vs 中 每 个 向 量 的 表示 法 是 唯一 的 . 

证 明 : 显 然 (1) 与 (2) 等 价 , 且 (4) 之 (3). 下 证 (1) 之 (4) 及 (3) 二 (1). 

(之 (4). 设 风门 到 三 410 如 果 对 任意 wE Vi 十 V; ,有 ax 一 o 十 o 一 Qi 十 Ql ,其 
中 国 \o EVi, wo EVi. 由 于 @ a EVisgs 0 EV Hea=o—w, 故 


0 一 gl = 02 一 0 EV NV 一 10} 
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此 即 om 一 对 = 二 0; 一 0 一 9, 从 而 ol 一 olyas 一 2. 

(3) 一 (1). 对 任意 向 量 a EVi 门 V,; 有 0 二 a 十 (一 @), 这 里 gg EVi, 一 @ € Vi. 
再 由 (3), 零 向 量 的 表示 法 9 二 0 十 9 是 唯一 的 ,因此 @& = 二 一 & 二 0. 由 @ 的 任意 性 可 知 
Vi 门 Vi = {0}. 证 毕 . 

显然 直 和 的 概念 及 其 结论 可 以 推广 到 多 个 子 空间 的 情形 . 

例 2.3.7 证 明 R= 二 SR” SSR™. 

证 明 : 因 为 任意 实 方 阵 A € RR” 可 以 分 解 为 一 个 实 对 称 矩 阵 和 一 个 实 反 对 称 和 矩阵 的 
和 , 即 


1 1 


A= 上 (AAT) 1 7(4—A')=B+C 


显然 , BT 二 B,C' 一 一 C, 即 BE SR”,CE SSR”. 这 说 明 R* = SR 十 SS 
R” 成立. 下 证 此 和 为 直 和 . 

证 法 一 :对 任意 矩阵 DE SR™ 站 SSR™, 有 DESR*™” 且 DE SSR”, 故 D7? = 
D 且 D' = 一 D, 从 而 D = 一 D, 解 得 也 为 零 矩 阵 , 即 SR 站 SSR 二 {0), 因而 R™ 
一 SR 四 SSR 


证 法 二 :由 式 (2. 2. 8) 和 例 2. 2. 17 可 知 , dimR”* 一 姑 ，dimSRwo 一 Fnln 十 1)， 


1 


再 由 习题 2.12, dim SSR” 一 n(n 一 1). 注意 到 = n(n 十 ]) 十 于 zz 一 1)， 故 


dimR” 一 dimSR” 十 dim SSR”, 因此 由 定理 2.3.7 即 得 R” 一 SR” @KR™. 
证 毕 . 

证 法 一 比较 简单 ,但 只 适用 于 判断 两 个 子 空间 是 否 存 在 直 和 分 解 ; 证 法 二 虽然 复杂 ， 
却 适用 于 任意 个 子 空间 . 

定理 2. 3.8 ( 直 和 分 解 ) 设 六 是 数 域 F 上 的 维 线性 空间 V 的 一 个 m 维 子 空间 
(这 m), 则 一 定 存 在 V 的 男 一 个 n 一 m 维 子 空间 Vi, 使 得 空间 V 具有 直 和 分 解 (direct 


sum decomposition) 
V=V®MV: 
并 且 若 Qi ,oz ，…on 为 Vi 的 一 组 基 , oo ;0s，…,@ 为 Vs 的 一 组 基 , 则 
CI G2 Om On yy Or 0 


为 V 的 一 组 基 . 

证 明 : 利 用 基 的 扩张 定理 即 可 . 具体 请 读者 完成 . 

我 们 称 这 样 的 Vi 和 Vs 是 一 对 互补 的 子 空间 (complemented subspace) ,或 者 称 
是 Vi 的 补 子 空间 (complement subspace). 显然 ,我 们 可 以 根据 需要 对 线性 空间 做 各 种 
各 样 的 直 和 分 解 . 

直 和 分 解 也 可 以 推广 到 多 个 子 空间 的 情形 . 

注意 :(1) 子 空间 的 补 子 空间 未 必 是 唯一 的 ,也 就 是 说 ,线性 空间 的 直 和 分 解 未 必 是 
唯一 的 . 例如 :车 二 (1,0,0)7,os 一 (0,1,0)7, 甩 一 (0,0,1)7, 及 一 (0,1,1)7. 显然 ， 
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US= Span(CCl 02 ) 是 R’ 的 一 个 子 空间 ,几何 上 很 容易 看 出 9 span(p ) 和 span(p,) 都 是 U 
的 补 子 空间 . 
(2) 三 个 子 空间 即便 两 两 直 和 ,这 三 个 子 空间 的 和 也 未 必 是 直 和 . 例如 , 知 
Vi es {x = & (1,0.0) sa 生 RR} 
Vs = {x=a(0,1,0)',a€ R} 
Vs se {x -= 讼 (1 1 DT EE R} 
显然 ,Vi 门 Vs = Vi 门 Vs 一 Vs 门 Vs = {0} ,但 是 
0= (000 = La (00 + Le (00) = 1 C1,1a0 
也 就 是 说 , 零 向 量 的 分 解 不 唯一 ,因此 R’” 关 Vi 旬 V; 加 Vi. 
下 面 我 们 不 加 证 明 地 将 定理 2. 3. 7 推广 到 多 个 子 空间 的 情形 . 
定理 2.3.9 设 Vi,V;,…,V, 是 数 域 F 上 线性 空间 V 的 个子 空间 , 则 下 列 命题 是 
等 价 的 : 
(1) 和 十 Vi 十 … 十 V; 是 直 和 ; 
(2) dim(Cw 十 Vw 十 … 十 V) == dimVi 十 dimV; 十 … 十 dimV,; 
(3) 和 Vi 十 Vi 十 … 十 V,; 的 一 组 基 为 


Qi 2 0 
这 里 dimV; 二 7i, 且 oa ,az，…ar 是 V; 的 一 组 基 (i 二 1,2,…,s). 
例 2.3.8 实数 域 R 上 的 多 项 式 空间 PPLzj, 有 下 列 直 和 分 解 : 
Plzx], = span(1) 中 span(z) © span(z’) DO span(x™!) 


例 2.3.9 R”= span(e) 中 span(e) 中 span(es ) 中 … 中 span(e,), 其 中 ei ,e;， 
es ye 为 nl 阶 单位 矩阵 的 列 向 量 组 , 称 为 R” 的 标准 基 . 
定理 2.3.10 设 xi ,oz ,…a, 是 数 域 耻 上 线性 空间 V 的 一 组 基 , 则 
V = Span(ol ) 中 span(@;) 中 … 中 span(a,) (2 3 


显然 , 式 (2. 3. 1) 是 对 线性 空间 V 最 彻底 的 直 和 和 分解 ,此 时 V 中 每 一 个 向 量 在 每 个 
span(@;) 中 都 存在 一 个 分 量 , 从 而 将 V 中 向 量 的 线性 运算 化 归 到 各 个 子 空间 中 ,这 显然 
与 坐标 方法 有 异曲同工 之 妙 . 


Ds 


线性 变换 是 线性 空间 的 核心 内 容 , 反 映 的 是 线性 空间 中 元 素 间 的 一 种 基本 联系 ， 
体现 出 一 种 “动态 的 "或 者 “直观 的 "视角. 借助 “ 基 ” 的 概念 ,可 在 线性 变换 与 矩阵 之 间 
建立 一 一 对 应 关系 ,从 而 将 线性 变换 的 运算 转化 为 矩阵 的 运算 . 一 言 以 蔽 之 “变换 即 
矩阵” 


2.4.1 几 个 简单 的 线性 变换 
让 我 们 从 几何 直观 开始 . 观察 图 2- 15, 图 形 经 过 反射 变换 (图 b) 或 旋转 变换 (图 f)， 
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只 是 位 置 改变 了 ,形状 和 大 小 都 没有 改变 ,所 有 的 长 度 、 角 度 都 保持 不 变 , 直线 仍然 变 成 
了 直线 ,三 角形 长 方形 正方形、 平行 四 边 形 、 圆 仍然 变 成 了 三 角形 、 长 方形 、 正 方形 、 平 
行 四 边 形 、 圆 ,也 就 是 说 ,变换 前 后 的 图 形 是 全 等 的 . 而 在 剩 下 的 图 形 中 ,图 形 经 过 伸缩 变 
换 (图 c 和 图 d) 及 Shear 切 变 (图 e) 后 ,虽然 位 置 没有 改变 ,而 且 直线 仍然 变 成 了 直线 ,三 
角形 .平行 四 边 形 仍 然 变 成 了 三 角形 .平行 四 边 形 , 但 图 形 的 长 度 、 角 度 、 形 状 和 大 小 都 有 
所 改变 ,正方 形变 成 了 长 方形 力 至 平行 四 边 形 , 圆 变 成 了 椭圆 ,也 就 是 说 ,变换 前 后 的 图 
形 未 必 是 全 等 的 . 


加 Xio110001 2 0b) Ar[-1.001] > (© Ae[1.500,1] 
1 1 

， 国 . 己 SS 
0 1 0 1 

2 (d) As=[1,0;0,0.5] (e) A=[1,0.5;0,1] ay A=[cos(t),~sin(t),cos(t)] 
1 1 | 1 

| 四 | /i 
"0 "0 


图 2-15 几 种 简单 的 线性 变换 


接 下 来 我 们 逐一 深入 人 研究. 
例 2.4.1 (旋转 变换 或 Givens 变换 ) 将 R* 中 的 任意 向 量 OB = (&,&) 绕 原点 逆 
时 针 旋 转角 0 至 OP” == (n,mw) ( 见 图 2- 16) ,显然 
nN = rcos(gat0) = 7rcosacosb 一 rsinasin0 = &cos0 — & sing 
及 二 7rsin(a 十 0) = 7rSinacosO 十 rcosasin0 = &cos0& sing 


-RON :7 ) 


$ P(E .&) 


图 2- 16 Givens 旋转 变换 图 2-17 Householder 反射 变换 


. 80 ， 矩阵 分 析 与 计算 


因此 像 (nm ,7 ) 与 原 像 (与 , 握 ) 之 间 的 关系 为 
A 


| n cos0 — sing 
Va 人 


其 中 ,和 矩阵 G = G(O), 称 为 Givens 矩阵， 显然 在 图 2- 15( 纪 中 , 0 一 /6. 
Ee ww S| 11 fm|_ /cos0 a — sing 
es =- (a sd 4 lel - sj- ( ) 时 ， | 中 \ cosg ) 
思考 :角度 0 为 何 值 时 ,可 使 得 ww = 0? 这 在 几何 上 意味 着 什么 ?你 觉得 这 种 变换 有 
意义 吗 ? 
例 2.4.2 (反射 变换 或 Householder 变换 ) 设 向 量 如 为 民 : 中 与 x 轴 正 向 夹 角 为 0 
eal 将 RR? 中 的 任意 向 量 OB = (&,) 以 4 为 轴 反 射 至 OP” = (sm) 
见 图 2-17). 显然 
m 二 7rcos(w 十 0) = rcosC20 一 (40 一 oa)) = rcos(0—a)cos20+ rsin(0— a)sin20 


6 
=o| | (2. 4. 1) 
外 


sing cosO 


握 cos20 十 所 sin20 
72 = rsin(a 十 0) = rcos(0—a)sin20—rsin(0—a)cos20 = & sin20— & cos20 


因此 像 (m ,ww) 与 原 像 ($1 ,所 ) 之 间 的 关系 为 
| 问 
三 H (2.4. 2) 


| 族 / cos20 sin20 
六 & & 


其 中 ,和 矩阵 吾 称 为 初等 反射 矩阵 或 Householder 矩阵 .显然 ,在 图 2- 15(b) 中 , 0 一 /2. 
从 映射 的 角度 看 ,旋转 变换 和 反射 变换 仍然 是 同 构 映 射 . 
例 2.4.3 (伸缩 变换 ,stretching transformation 或 dilation transformation) 将 民 : 
中 的 任意 向 量 O5 二 (5 ,名 ) 的 两 个 分 量 分 别 拉 伸 a 倍 和 2 售后 变 成 OF = (m ,mw), 显 
然 ,这 时 像 (7 , 产 ) 与 原 像 (5 ,2) 之 间 的 关系 为 


"| a 0 
六 
其 中 ,矩阵 也 是 对 角 和 矩阵 . 经 过 此 变换 ,显然 ,单位 圆 xz? 十 y 二 1 变 成 了 椭圆 研学 二 


特别 地 , a 二 1.5,65 二 1 对 应 图 2 一 15(c), a 二 1,6 二 0.5 对 应 图 2 一 15(d). 从 映射 的 角度 
看 ,伸缩 变换 显然 也 是 同 构 映 射 . 

作为 对 比 , 我 们 再 介绍 两 个 特殊 变换 . 

例 2.4.4 (投影 变换 ,projective transformation) 考 察 RR? 中 的 投影 变换 


sin20 一 cos20 


£ 
Sl 


人 
(2. 4. 3) 


P(r,y,z) (Ty,0) (2. 4. 4) 


2 2 ca /2 /2 上 
显然 ,P 将 椭 球 体 训 十 襄 1 2 二 1 变换 成 zoy 平面 中 的 椭圆 3 十 一 1,z 二 0, 即 
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x 1 A fs Ke 
yl=|0 1 0llyl|=Pl|y 
z/ @ 人 Ol 型 


其 中 ,和 矩阵 己 称 为 投影 矩阵 (projective matrix ). 

从 映射 的 角度 看 ,上 面 的 投影 变换 仅仅 是 同 态 映射 ,不 是 同 构 映 射 , 因为 R” 中 任何 
与 z 轴 平 行 的 直线 上 的 点 都 被 压缩 到 该 直线 与 xoy 平面 的 交点 处 ,这 使 得 R” 中 大 量 的 
向 量 都 对 应 同一 个 向 量 . 当然 ,这 个 投影 变换 也 导致 我 们 完全 丢失 了 第 三 个 维度 的 信息 . 

例 2.4.5 (分形 蕨 ) 图 2- 18 是 运行 文献 L110] 
中 提供 的 程序 fern 所 得 的 结果 ,显然 可 以 看 成 右 下 方 
的 子 藤 被 不 断 收缩 并 往 上 平移 ,同时 这 个 子 蕨 被 反射 
到 葵 干 左 侧 后 也 如 法 炮制 . 事实 上 ,fern 的 代码 中 涉及 
了 仿 射 变换 (affine transformation) A:xPAx 十 b. 由 
例 2. 2. 18 可 知 仿 射 变换 4 不 是 线性 变换 . 

可 以 证 明 , 旋 转变 换 、 反 射 变换 和 平移 变换 是 R? 
中 三 种 最 基本 的 全 等 变换 (congruent transformation， 
又 称 合同 变换 ). 在 合同 变换 下 ,直线 变 为 直线 ,线段 变 
为 线段 ,射线 变 为 射线 ,三 角形 、 多 边 形 和 圆 分 别 变 为 
与 它们 全 等 的 三 角形 多边形 和 圆 ;两 直线 的 平行 性 、 四 
垂直 性 ,所 成 的 角度 都 不 变 ; 共 线 点 变 为 共 线 点 , 且 保持 顺序 关系 不 变 ; 直 线 上 A、B、C 三 
点 的 简 比 AC : BC 不 变 ;封闭 图 形 的 面积 不 变 . 遗憾 的 是 ,平移 变换 却 不 是 线性 变换 ,而 
伸缩 变换 、 投 影 变 换 等 反而 是 线性 变换 ,这 无 疑 给 线性 变换 披 上 了 神秘 的 面纱 . 


2.4.2 线性 变换 及 其 性 质 


2.2.4 小 方 中 己 指出 ,线性 空间 Vi 到 V; 的 (线性 ) 同 态 映 射 也 称 为 线性 映射 . 线性 空 
间 V 到 自身 的 自 同 态 映射 也 称 为 线性 变换 . 由 于 同 态 概念 的 适用 范围 更 广 ( 比 如 群 的 同 
态 ), 因 此 在 线性 代数 中 ,我们 更 垂青 于 名 词 “ 线 性 映射 ?与 “线性 变换 ”下面 对 它们 进行 
深入 研究 . 

定义 2.4.1 (线性 映射 和 线性 变换 ) 设 Vi,V, 是 数 域 FF 的 两 个 线性 空间 ， 
7:wW PVz 是 Vi 到 Vi 的 映射 (未 必 是 双 射 ), 如 果 对 任意 的 ga,BE Vi 和 任意 的 &EF, 都 有 

(1) 可 加 性 : Tg 十 让 一 To) 十 万 (有 ); 

(2) 齐 次 性 : TT(kaq) = 二 kT(@); 

或 合 在 一 起 ,就 是 

(3) 线 性 性 : 开 (ka 十 人 B) 二 AT Go) 十 TCD ,wpEW ,REE, 则 称 万 是 全 到 人 
的 线性 映射 ,并 称 T(w) 为 a 在 本 下 的 像 , 称 & 是 十 (a) 的 原 像 . 

特别 地 ,如 果 Vi 二 Vs = 二 V, 则 称 工 是 V (在 数 域 F) 上 的 线性 变换 ;如 果 Vi = V， 
V: 三 下, 则 称 开 是 V (在 数 域 B) 上 的 线性 泛 函 . 

显然 上 一 小 节 的 几 个 线性 变换 ,有 的 可 以 推广 到 任意 线性 空间 V (比如 投影 变换 和 
反射 变换 ). 
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思考 : 易 知 二 次 型 和 迹 都 是 矩阵 空间 RR (在 实数 域 RR ) 上 的 线性 泛 函 ,那么 矩阵 的 
秩 是 不 是 RR” 上 的 线性 泛 函 ? 方 阵 的 行列 式 呢 ? 

例 2.4.6 将 线性 空间 Vi 中 每 个 向 量 w 映射 成 线性 空间 Vs 中 的 零 向 量 b 的 映射 
是 一 个 线性 映射 , 称 为 零 映射 , 记 为 O, 即 O(o) ==0 , 这 里 任意 wxEW. 当 凤 一 交 一 V 
时 , 称 零 映射 为 零 变 换 , 仍 记 为 O. 

例 2.4.7 将 线性 空间 V 中 每 个 向 量 w 映射 成 它 的 常数 倍 的 线性 映射 是 一 个 线性 
变换 , 称 为 标量 变换 (scalar transformation) 或 数 乘 变 换 , 记 为 Kk, 即 K(w) 一 hm, 这 里 
& € Vi,k € FF. 特别 地 , 当 &= 1 时 称 为 恒 等 变 换 , 记 为 ; 当 k = 0 时 就 是 零 变换 O. 

例 2.4.8 (微分 变换 ,differential transformation) 设 V 为 数 域 民 上 的 无 限 次 可 微 
函数 空间 C”[La,6bj], 则 

DCFCz)) = f(x), fx) € C"[a,b] (2 

确定 的 微分 变换 是 C*La,o] 上 的 一 个 线性 变换 . 

思考 :有 限 次 可 微 的 情况 又 如 何 ” 对 多 项 式 空 间 PLxj, 呢 ? 

例 2.4.9 (积分 变换 ,integral transformation) 设 V 为 数 域 RR 上 的 连续 函数 空间 
ClLa,0j, 则 


I(f(z)) = [far, fx) € Cla,b] 


确定 的 积分 变换 了 是 CLa,b] 上 的 一 个 线性 变换 . 
例 2.4.10 ( 带 核 的 积分 变换 ) 设 V 为 数 域 R 上 的 连续 函数 空间 C[a, 妇 , 则 


b 
£(s) = | kD fd HAY €& [a 


确定 的 积分 变换 C 是 (积分 ) 核 (integral kernel) 为 k(s,?) 的 一 个 线性 变换 ， 


比如 , 拉 普 拉 斯 变换 (Laplace transformation) 
十 oo 
CGO 一 | efGDd Fo € CLo, te) 


就 是 CL0, 十 w) 上 (积分 ) 核 为 kGs,1) 二 e 的 积分 变换 . 

例 2. 4. 8 和 例 2. 4. 9 表明 , 微 积分 的 两 个 基本 运算 (微分 和 积分 ) 从 变换 的 角度 看 ， 
仅仅 是 两 类 特殊 的 线性 变换 或 线性 算 子 ,由 此 可 知 线性 变换 的 胸怀 有 多 么 宽广 ,在 理论 
与 应 用 中 有 着 多 么 广泛 的 应 用 . 

例 2.4.11  ( 移 位 算 子 ,shift operator) 对 于 /” 中 的 任意 数列 {zx,}, 规定 

Bx = Teai(n 2 2), Br = 0; Fx, = Tn 

显然 ,可 证 B; 和 无, 是 ”中 的 线性 算 子 ,分 别称 为 前 向 移 位 算 子 (forward shift operator) 
和 后 向 移 位 算 子 (backward shift operator). 

线性 映射 也 具有 和 同 构 映 射 类 似 的 一 些 性 质 . 

定理 2. 4. 1 (线性 映射 的 基本 性 质 ) 设 7 是 线性 空间 Vi 到 W 的 线性 映射 , @ ,o ,…， 
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@, 是 Vi 中 的 任意 向 量 组 , 则 
(I1)( 零 元 到 零 元 ) : (0) 二 0, 其 中 0 为 V, 中 的 零 元 . 
(I2)( 负 元 到 负 元 ) :对 任意 wE ww , 有 T (一 x) = 一 T(@). 
(13) (县 加 性 或 线性 性 ): 


T (kiai 十 RzC2 十 和 十 ka,) = ki 了 (ai ) 十 ARz 了 (ax ) 十 … 十 T (a,) 


(I4a) (线性 相关 组 到 线性 相关 组 ) : 若 CI 02 ，… 0: 线性 相关 , 则 了 (al), 了 (as )，……， 
十 (@,) 也 线性 相关 ;也 就 是 说 ,车 本 C01) , 丁 (@),…, 丁 (@,) 线性 无 关 , 则 ol ,os ,…,@, 也 
线性 无 关 . 

(15)( 子 空间 到 子 空 间 ) :车 U 是 Vi 的 子 空间 , Qi,@,…,@; 是 U 的 一 组 基 , 则 U 
中 所 有 向 量 在 万 下 的 像 的 集合 T(D) 是 wz 的 子 空间 ,并 且 帮 (U) = span(T (ai )， 
Taz)，…7(CC:))， 

证 明 : 只 证 性 质 (I4a) 和 (15). 

(I4a) 的 证 明 : 如 果 存 在 不 全 为 零 的 一 组 数 ki ,Rk2,** ,Rk,, 使 得 ki@i 十 kz@2 十 … 十 
ka; 一 9, 那么 由 县 加 性 即 性 质 (13) 可 知 


RIT) hk Te) tk To) = Thko th ha.)=0 
(15) 的 证 明 : 若 U 中 任意 向 量 可 表示 为 = ki@giTkz@ Tka,, 则 由 又 加 性 可 知 
T(P=RT) Th Te) Tk Ta) € span(T (a) ,Tg) ,TT (0)) 


反之 , span(T(o) ,To ) ,To)) 中 任意 向 量 可 表示 为 户 = 二 和 T(@i) 十 
kp 本 (@2) 十 … 十 kT(@,)，, 同样 由 到 加 性 可 知 其 原 像 为 B= ii 十 ko'@ 十 … 十 ka 
且 BEU. 因此 TCD) 是 V; 的 子 空间 , 且 生 成 元 为 To),7T (oz),…,T (ax.). 证 毕 . 

当 线 性 映射 特殊 化 为 线性 变换 时 ,性 质 (I1) 说 明 线性 变换 保持 线性 空间 的 原点 不 变 ， 
这 一 点 从 图 2 一 15 中 可 清晰 看 出 . 此 性 质 再 次 说 明 , 改 变 了 原点 位 置 的 变换 (例如 平移 ) 

肯定 不 是 线性 变换 . 另外 ,请 读者 一 定 要 注意 , 非 原 点 经 过 线性 变换 后 也 可 能 成 为 了 原 
点 ,例如 投影 变换 就 将 = 轴 上 的 点 都 投影 到 原点 . 

性 质 (I2) 则 说 明 线 性 空间 中 任意 一 点 e 的 对 称 点 一 a 的 像 就 是 像 的 对 称 点 . 例如 在 
PLxj 中 ,将 多 项 式 f(x) = ax’ 十 红 十 c 的 首 项 系数 反 号 而 其 他 系数 不 变 的 变换 ,实质 上 
就 是 R” 中 将 点 (ab,c) 沿 yoz 平面 反射 到 点 (一 a,b,c), 即 PLzxj 关于 其 n 一 1 维 平面 
的 反射 变换 . 

至 于 (CI4a) ,显然 与 同 构 映 射 不 同 ,这 是 因为 线性 映射 未 必 是 一 一 对 应 的 ,如 零 映射 O. 
这 自然 让 我 们 想到 :什么 样 的 条 件 才能 使 线性 映射 特殊 化 为 同 构 映射 ? 

定义 2.4.2 设 芽 :ViPV 是 线性 空间 Vi 到 V 的 线性 映射 . 称 Vi 在 万 下 的 所 有 像 
的 集合 本 (Vi) 为 芽 的 值 域 (range) , 记 作 Im(T) 或 R(T), 称 W 中 的 零 向 量 0 在 本 下 
的 所 有 原 像 的 集合 为 芽 的 核 (kernel) , 记 作 Ker(CT) 或 NIT), 即 


Im(T) 二 R(T)={T(a)| VaE€E Vi) 


Ker(T)=N(T)= {a EV |T(a) = 0) 
易 证 In(7 ) 是 Vs 的 子 空间 , Ker(T) 是 Vi 的 子 空间 . 同时 ,由 性 质 (I5) 可 知 
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Im(T) 二 span(T (ol ) 7T (2) ,TG,)) 《外 4. 6) 


这 里 @i ,zy,…,@, 是 Vi 的 一 组 基 . 

定义 2.4.3 设 古 :Vi PV 是 线性 空间 Vi 到 VV; 的 线性 映射 , 称 Im(7 ) 的 维 数 为 了 的 
秩 (rank) , 记 为 rank(7 ), 称 Ker(7 ) 的 维 数 为 了 的 亏 或 零度 Cnullity), 记 为 null(7 ). 

例如 ,对 投影 变换 也 来 说 , Im(P) 就 是 R? 中 的 zoy 平面 , rank(P) 一 2, 即 经 过 投 
影 变 换 , 民 : 损失 了 1 个 维度 . 同时 , Ker(P) 就 是 R? 中 的 z 轴 , null(P) = 1, 这 也 说 明 
R? 损失 的 维度 转移 到 了 空间 Ker(P). 

一 般 地 ,对 线性 空间 Vi 到 V: 的 线性 映射 记 , 设 null(7 ) = 二 r+, 则 可 在 Ker(T7T) 中 取 
到 一 组 基 ol ,az ,…,@,， 并 按 基 的 扩张 定理 ,将 之 扩充 为 VV 的 一 组 基 ol ,os ，……,or CrH， 
ar, 由 式 (2.4.6), 并 注意 到 古 (@1), 丁 (@),…, 丁 (@,) 都 是 V 中 的 零 向 量 0 ， 
显然 有 


Im(T) 王 span(TCo) To) Tm) ,Tan) ,TGs) ,Tg,)) 
= span(T Co ) Tg) ,TT (0,)) 
我 们 自然 要 接着 问 : Tc) ,本 (@w),…, 丁 (@,) 是 线性 无 关 的 吗 ? 答案 是 yes! 事 
实 上 , 设 
kn Ta) Tk Tm) Tk Tu,) = 0 


则 由 春 加 性 可 知 万 (Earl 十 Pa 十 和 十 bo 二 0, 即 向 量 ji@4i 十 Riz04s 
十 … 十 By E Ker(7T) ,因此 可 将 之 表示 为 


RQ 十 RCH 十 十 An 一 AICI 十 AR0a “二 


注意 到 , ol ,@2,…,@, 线性 无 关 , 故 可 得 书 k» i Rk 0. 因此 厂 (@n1)， 
Ta) ,Co ) 是 线性 无 关 的 , 即 rank(T) 一 7 一 1 

定理 2.4. 2 ( 秩 十 零度 定理 ) 设 7 了 是 ” 维 线性 空间 Vi 到 m 维 线性 空间 Vi 的 线性 
映射 , ol yoz，…o, 是 Vi 的 一 组 基 , 则 : 

(1) Im(T) 和 Ker(T) 都 是 7 的 子 空间 ; 

(2) Im(T) = span(T (al ) ,7T Co ) ,TT (0,)); 

(3) rank(T ) 十 null(7) 一 2， 即 


dim(Im(T)) dim(Ker(T))=n (2.4.7) 


根据 式 (2. 4.7), 显然 , 当 且 仅 当 null(7) = 0 , 即 Ker(T) 为 零 空 间 时 ,线性 映射 万 
特殊 化 为 同 构 映 射 ,这 也 意味 着 此 时 rank(T) 二 nn. 特别 地 , 当 厂 是 n 维 线性 空间 V 上 的 
线性 变换 时 , rank(7 ) 二 n 意味 着 Im( 覆 ) 一 V, 我 们 称 此 时 的 T 为 满 秩 线性 变换 ,否则 
就 称 为 降 秩 线性 变换 . 

虽然 dm(CIm(7)) 十 dim(CKer(7 )) 二 ,但 一 般 地 Im(T) 十 Ker(T) 关 V, 例如 对 
PL xz], 上 的 微分 变换 D:fPf ,有 Im(D) == PLxj,1, Ker(D) 二 民 , 但 显然 Im(D) 十 
Ker(D) 三 开元 | EPL],, 

仔细 再 看 看 式 (2. 4. 7), 其 中 只 涉及 Vi 的 维 数 n, 这 让 Vs 的 维 数 m 情 何以 堪 ! 事实 
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上 , m 已 被 深 深 雪 藏 ,需要 更 精巧 的 工具 才能 揭示 出 来 ,详情 下 一 小 节 揭 晓 . 

回头 再 看 投影 变换 PP, 任意 向 量 we 二 (zx,y,z) 被 变换 成 a 一 P(g) 一 (zx,y,0), 显 
然 ,如 果 再 用 一 个 投影 变换 P“ 将 像 a 投影 到 z 轴 , 最 终 得 到 的 是 w = (z,0,0), 根据 三 
垂 线 定理 ,这 显然 也 可 以 看 成 @ 一 (zx,y,z) 被 某 个 投影 变换 直接 投影 到 工 轴 . 这 说 明 两 个 
线性 变换 可 能 会 合成 一 个 新 的 线性 变换 . 这 与 函数 的 复合 显然 类 似 , 因此 我 们 有 必要 研 
究 线性 变换 乃至 线性 映射 的 运算 . 

设 芽 ,十 “都 是 线性 空间 Vi 到 V; 上 的 线性 映射 ,对 任意 a E Vi 及 任意 有 € FF, 分 别 
定义 厂 ,7 的 和 万 十 厂 ”、 数 乘 &T 为 


(T+TIOCa) =Te) Tg), (kT)(a) = kT(a) 
显然 ,对 任意 ,BP E Vi 及 任意 p,q EF, 有 


(T+T) pataqB)= Tpatap)+T (pa 十 gp) 
=pT(g)+gqT(PB+pT Ce) 二 TD) 
一 站 Tao) tT (0)) Haq T+T 有) 
二 p(T 十 本 (a) 二 q(T 二 T)(p) 


因此 , 厂 十 区 “是 线性 映射 . 同 理 可 证 & 厂 也 是 线性 映射 . 
可 以 证 明 , 厂 十 十 “、k 古 也 满足 “八条 运算 规律 ”. 这 意味 着 线性 空间 VV i 
有 线性 映射 的 集合 L(Vi,V;) 也 是 线性 空间 (其 零 元 就 是 零 映 射 O ). 当 Vi = 二 V; 二 V 时 ， 
L(Vi,V) 就 简 记 为 L(V), 表示 VV 上 所 有 线性 变换 构成 的 线性 空 wd 
这 真是 个 “虚拟 的 二 八 佳人 ”或 “数码 美人 ”, 因 为 L(Vi,V;) 或 L(V) 中 的 元 素 不 是 矩阵 、 
多 项 式 或 函数 之 类 的 实体 ,而 是 似乎 看 不 见 也 摸 不 着 的 线性 映射 或 线性 变换 . 事实 上 ,如 
果 将 V 特殊 化 为 民 , 那么 L(V) 就 是 RR 上 所 有 的 线性 函数 构成 的 线性 空间 . 
提 到 函数 ,我 们 自然 联想 到 反 函 数 , 这 就 要 定义 线性 映射 的 乘积 . 如 果 T € L(Vi， 
V2) ,而 堵 ^ ELOVs,V;3), 则 厂 , 克 “的 乘法 十 ' 古 定义 为 
(T Ta) =T (Ta),aE VW 


同样 可 证 乘积 二 和 古 是 线性 空间 Vi 到 Vs 的 线性 映射 . 线性 映射 的 乘法 也 满足 结合 
律 和 两 个 分 配 律 . 
特别 地 ,对 于 线性 变换 7 E L(V), 我 们 可 定义 芽 的 窜 为 
T°=I,T"=TT"! (m1) 


对 于 多 项 式 f(T) 二 a 7 十 ac TT 中 十 一 十 qi 古 十 ao € P[], 可 类 似 地 定义 变 
换 厂 €E L(V) 的 多 项 式 f(T) 为 
f(T) =a, Tia Tlic+a Ta 
对 线性 映射 的 乘法 来 说 , 恒 等 变 0 1 的 效果 , 即 Iv7T = 
TIv 一 了 ,这 里 7 E L(Vi,Vs). 进一步 地 ,我 们 可 引入 可 逆 线 性 映射 的 概念 . 
定理 2. 4.3 de TELVi,V;). 如 果 厂 是 可 道 映射 , 则 其 道 映射 
T7711 也 是 线性 映射 , 且 T71 € L(V ,Vi). 
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证 明 : 显 然 77 =Tv ,TI1T 二 Iv. 因此 对 任意 @,BE Vi 及 任意 p,q EF, 有 
Ti(pat agp)= TTv, pat gpB)) = T (pIv, (Co) + qTy, (P)) 
= TpTT) (0) + a TT )P) 
=T(pTTHI0)) +gT(TH (Pp)) 
=T(T(pT (0) qT (Pp))) 
= (TT}YpT (08) tgT-1(P))) 
= Iv pTii(0) iaqT pp)) = pTi(0) tqT- pp) 
证 毕 . 
由 定理 2. 2.5 可 知 , 7 是 线性 空间 Vi 到 V; 的 可 逆 线 性 映射 ,等 价 于 了 T 是 线性 空 
间 Vi 到 V: 的 同 构 映 射 ,再 由 线性 空间 的 同 构 定理 可 知 dimVw; 二 dimVz. 这 好 像 又 绕 回 
到 “万 物 之 本 ”了 . 


2.4.3 线性 变换 的 矩阵 表示 


由 上 一 小 节 可 知 ,对 线性 空间 V 上 的 可 逆 线 性 变换 7 而 言 , 显 然 存 在 逆 变 换 7 一， 
使 得 77 一 一 7 三 一 工 , 这 与 矩阵 及 其 着 矩 阵 极其 相似 . 事实 上 ,在 旋转 变换 、 反 射 变换 
和 投影 变换 中 ,都 分 别 活跃 着 Givens 矩阵 .Householder 矩阵 和 投影 矩阵 的 身影 . 这 自然 
诱 使 我 们 将 具体 的 矩阵 与 抽象 的 线性 映射 联系 起 来 ,从 而 将 线性 映射 的 运算 转化 为 矩阵 
的 数值 计算 . 这 中 间 的 桥梁 ,显然 就 是 与 坐标 轴 类 似 的 线性 空间 的 基 . 

设 芽 是 nn 维 线性 空间 Vi 到 m 维 线性 空间 V; 的 线性 映射 ,qm ,mz,…,@, 是 Vi 的 一 组 
基 ， PB Pb; .i BbB, 是 Vs 的 一 组 基 . 显然 , 像 了 (ci ) :了 (oo) (Ca) 都 可 由 Bh ,Pb + 
表示 出 来 , 故 可 设 ( 注 意 系数 的 下 标 ) 


了 (ai) = up 十 azp 十 … 十 ap, (1 二 1 ,2, wsn) (2. 4. 8) 
着 令 古 (@i ,24) 十 (@0), 古 (@2)…,T(@,)), 则 上 式 可 形式 地 记 为 


CLII CI2 ”Qi 
Q21 4022 dU2n 


T (a 2 0) Ee (ph ,Pp spBn) , > = (pi ,Pp 4 


ml Um2 A Cm 
(2. 4. 9) 


其 中 ,矩阵 A 站 (ay ) pen 称 为 线性 映射 芽 在 Vi 的 基 Ql O20 和 V; 的 基 忆 ,Pp 本 
下 的 矩阵 (表示 ). 此 时 ,对 Vi 中 的 任意 向 量 = ZI0I 十 Za202 十 十 Zr 和 其 在 V, 中 的 像 
T(@) = yp 二 yyB 十 … 十 ywBr， 记 坐标 向 量 x 二 (人 DT 一 (CT 
显然 


T(@)= Tra rm 十 … 十 Zr) 二 ZTC) 十 ZTCoo) 十 … 十 ziTCa) 
二 (7 (ol),T oo) TCD)XZ = (PB, ,pb,)Ax 


考虑 到 还 有 了 (ao) 一 〈 房 , 房 ,…… 肥 )7, 由 坐标 向 量 的 唯一 性 , 即 得 坐标 变换 公式 
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y= Ax (2. 4. 10) 


显然 , 式 (2.4.9) 构造 了 L(Vi,V) 到 RR 的 一 个 映射 4:7TH>y4 ,而且 和 矩阵 .4 由 
线性 映射 7 了 唯一 确定 . 事实 上 ,可 以 证 明 4 是 L(Vi,Vs) 到 R” 的 同 构 映射 . 因此 
dimL(Vi,V2) 二 mam, 且 LCVi,V;) 中 的 每 一 个 线性 映射 都 可 由 RR 中 的 一 个 m Xn 算 
阵 来 代表 . 

特别 地 , 当 VV 二 Vi 二 V 且 基 @i ,ws ,ou 就 是 基 ,Pp ，,…,p, 时, 式 (2.4.9) 特殊 
化 为 


Ql CI12 Cl 
C21 人 22 CQ2 

T (a ，Q2 »"*° ,0 ) 3 (Cr »Q2 »*** ,0 ) = (on 322 0 
Unl Qn2 Qim 


(2.4.11) 


即 L(V) 中 的 每 一 个 线性 变换 都 可 用 RR” 中 的 方 阵 来 代表 ,而 且 线性 变换 的 和 对 应 矩阵 
的 和 ,线性 变换 的 数 乘 和 乘积 分 别 对 应 矩阵 的 数 乘 和 乘积 ,可 逆 线 性 变换 的 送 变 换 对 应 
可 逆 和 矩阵 的 闭 矩 阵 . 一 言 以 蔽 之 ,矩阵 即 变换 。 

实际 上 , 早 在 初学 线性 代数 时 ,矩阵 就 已 与 变换 水 乳 交 融 了 . 最 典型 的 莫 过 于 本 书 一 
开始 就 指出 的 “初等 矩阵 与 初等 变换 之 间 的 关系 ”, 即 定理 1. 1. 1. 


用 和 拖 阵 与 变换 也 可 以 赋予 行列 式 几 何 意 义 . 以 二 阶 和 矩阵 A = (@i ,@;) = 


为 例 ,将 之 看 成 以 m ,o 为 邻 边 的 平行 四 边 形 ,其 面积 函数 记 为 So ,w) 或 S(4). 显然 
SCD 王 1]. 从 几何 上 易 证 SCo ,wo ) 的 下 列 性 质 : 

(1) 列 交换 性 , 即 SCal ,oz ) 一 SCaz ,al ); 

(2) 列 可 加 性 , 即 SC ,oz ) = SCai 十 ca ,oz ); 

(3) 列 数 乘 性 , 即 SCcal ,az ) 一 | clSCoi ,os ). 

若 wi ,02 线性 相关 ,显然 S(4) = 0 一 | det(A) | ; 若 Qi ,oz 线性 无 关 , 设 au 了 关 0( 否 
则 交换 @ 与 w ), 则 


dl a12 


Qll 0 
CIll Qiz 


S(A)= s| 


dQ21 U22 


Ul2 


= |an| | a 一 下 aa 
11 


sl 


= |anazs — awaa| S(T) = |det(A)| 
用 初等 变换 来 解释 , 则 分 别 有 
B= (gz,0) 一 Co4, 有 一 (ol 十 cazoz) = Cl)A, B= (cao,0m) = C(O A 
注意 到 det Cs == 一 1, det Ca (c) 二 1, det Gi(c) = c, 因此 由 柯 西 定理 ,分 别 可 得 
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|detB| 王 | detCuo | |deth|=|detA| 
|detB|=|detA||detB|=|c| |detA| 


这 显然 就 是 上 述 三 条 性 质 . 因此 ,二 阶 和 矩阵 4 的 行列 式 deth 就 是 相应 平行 四 边 形 的 
“有 向 ?面积 . 

上 述 解释 可 自然 地 推广 到 3 阶 (平行 六 面体 的 有 向 体积 ) 乃 至 n 阶 方 阵 ( 单 纯 形 的 有 
向 体积 ) ,有 兴趣 的 读者 可 对 此 进行 深入 人 研究. 

再 比如 ,为 什么 “ 负 负 得 正 ”? 为 什么 六 == 一 17? 在 2.1.3 小 节 中 , 韦 塞 尔 已 经 给 出 了 
解答 . 现在 我 们 用 和 矩阵 与 变换 的 关系 ,能 给 予 详细 解释 . 

在 RR? 中 , 记 e 二 (1,0)',i 二 (0,1)', 显然 当 0= /2 时 ,有 


你 二 纪 | 性 
c()- 


若 记 G(x/2) 二 G, 即 为 Ge 一 六 用 变换 来 解释 ,就 是 将 向 量 e 逆 时 针 旋 转 x/2, 就 能 
得 到 向 量 i. 从 而 和 矩阵 运算 与 旋转 变换 相 吻 合 . 显然 ,如 果 再 将 向 量 i 道 时 针 旋 转 x/2, 就 
得 到 了 向 量 一 e, 而 计算 可 知 Gi 二 一 e, 两 者 亦 吻 合 . 这 也 说 明 连 续 两 次 逆 时 针 旋 转 x/2， 
向 量 e 就 变 成 了 向 量 一 e, 即 Ge 二 G(Ge) = Gi = 一 6. 进一步 地 ,由 于 G: (Cr/2) 二 G(x)， 
故 G(r)e = 二 一 e, 这 说 明 将 向 量 e 逆 时 针 旋 转 x, 就 得 到 了 癌 量 一 . 

现在 退化 到 一 维 的 情形 . 此 时 e 对 应 1, i 对 应 i, 因此 Ge = 二 i 对 应 i，1 二 i, 即 G 对 
应 i 从 而 G? 对 应 己 , Gze == 一 e 对 应 这。1 = 一 1, 此 即 六 = 一 1. 

由 于 G(T) (一 e) 一 e, 即 G (一 e) 二 @, 这 显然 对 应 着 站， (一 1) = 1, 也 就 是 (一 1)… 
(一 1) 二 1, 至 此 ,我 们 就 不 难 理解 “以 毒 攻 毒 ” 的 “ 负 负 得 正 ” 法 则 了 . 

思考 :如 何 解 释 (一 1D) 。 (二 1) = 一 1，( 十 1) . (一 1) = 一 1 以 及 i.2 二 2i 呢 ? 

按照 线性 变换 与 矩阵 的 对 应 关系 ,借助 于 线性 变换 的 矩阵 表示 ,式样 繁多 的 线性 变 
换 问 题 ,借助 于 适当 的 基 和 和 坐标 ,可 转化 为 统一 的 矩阵 和 向 量 运算 问题 . 我 们 也 不 用 再 关 
心 这 些 线性 变换 的 具体 形式 和 内 容 , 从 而 抹 去 了 它们 各 自 的 个 性 . 反 过 来 ,矩阵 向 量 积 
至 于 矩阵 乘法 ,也 可 看 成 线性 变换 . 这 就 能 使 我 们 以 一 种 “一 览 众 山 小 ”的 视角 ,来 看 待 具 
体 而 繁杂 的 矩阵 运算 ,从 而 更 逼近 问题 的 本 质 . 从 这 个 意义 上 讲 , 线 性 变换 反而 体现 了 一 
种 动态 的 直观 .几何 的 手段 . 

说 到 变换 ,我们 再 说 个 小 笑话 . 汤 教 授 某 日 因 事 不 能 去 上 课 , 事 先 在 教室 里 贴 出 如 下 
通知 :“Professor Tang will be unable to meet his classes today. ”一 学 生 项 劣 , 上 前 将 
“classes” 之 “c” 擦 去 , 众 阅 之 , 哄 和 党 大 笑 . 诺 料 教授 责任 心 强 ,办 完事 后 就 勿 忙 赶 回 . 看 到 学 
生 的 恶作剧 ,他 并 未 勃然 大 她 , 而 是 略 加 思索 ,然后 又 把 "lasses” 的 首 字母 探 去 . 众 阅 之 ， 
甸 大 呼 小 叫 , 懂 车 驴 鸣 . 

思考 :上 面 无 非 把 一 个 单词 变换 成 了 另 一 个 单词 ,但 这 种 变换 是 线性 变换 吗 ? 

例 2. 4. 12 (旋转 变换 的 逆 变 换 ) 将 民 : 中 的 任意 向 量 OF = (5 ,&) 绕 原点 顺 时 针 
旋转 角 9 至 OF 二 (六 , 思 )， 易 知 像 (7 ,六 ) 与 原 像 (5 ,名 ) 之 间 的 关系 为 
cosO sing 


| 。 
防 一 SinO cos0) | 名 


0 


=i 


1 @ 0 


上 
=G'(0) 
& 
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显然 ,此 线性 变换 就 是 例 2. 4. 1 中 的 旋转 变换 的 道 变换 ,并 且 其 矩阵 C (0) 也 是 
Givens 矩阵 G(0) 的 逆 和 矩阵 . 
例 2.4.13 民 ; 中 的 投影 变换 人 了;(zx,y,z) -> (x,y,0) 在 基 e 一 (1,0,0)7,e, 一 
(0,1,0)T, es 二 (0,0,1)T 下 的 矩阵 为 
i to 


P=|0 1 0 
0 0 0 


思考 :如 何 用 基 el ,es ,e; 来 表示 和 矩阵 P? 

例 2.4.14 考察 PLxj, 中 的 微分 变换 D(f) = ,f/f € PL[xj,, 由 于 标准 基 1,z， 
如,… 在 下 的 像 分 别 为 

了 (1) 王 0 二 0。1 十 0 六 十 0。 妇 十 十 0。2zr2 十 0 。21 

DCz) 一 1 一 1。1 十 0。 并 十 0。 和 好 十 十 0。2r 2 十 0。2z1 

了 (zz) 一 2 一 0。1 十 2 .zz 十 0。 妇 十 十 0。zr2 十 0 ,x 站 


的 


D(X™) 一 (一 1])z 有 一 0。1 十 0。z 十 十 0 。z3 十 (一 1) 。z2 十 0 。zl 
因此 , 在 标准 基 1,zx,x?,…,zx”""' 下 的 矩阵 为 


0 4 0 

外 和 学 0 
A= 

@ 和 0 | 

0 0 © 0 


例 2.4.15 在 矩阵 空间 RR” 中 ,对 任意 和 E 民 ””, 定义 线性 变换 ， 
TX) = XB, B= 和 ) 


1 ~—}1 
求 7 在 RR*” 的 标准 基 下 的 矩阵 . 
解 : R* 的 标准 基 为 Ell ,Ei , ,Es, 并 且 
1 QVy1 1 | | 
T(EN) = EBS= % jl _ 1)= 0) = En + Es 
二 一 1 CE 十 1 。 FE; 二 +0 E+0. E,, 
一 


0 )=E —E=1 a Bait(=1) . Ei 二 0 S 五 ?1 十 0 全 FE, 


1 
T(E)=E,B= (s 


0 


0 
T(E;» )—EaB=|() 一 十 五 > 一 0 S El = 各 办 Ei 二 1 * E;il 和 E,, 


0 


0 
1 _ 1)=Es Es=0° Ent0. Est1. Eat(—1) . E 


T(E,)=E,,B= ( 
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所 以 7 在 民 25 的 标准 基 下 的 矩阵 为 4 一 (六 


1 0 
B 网 所 i 一 让 名 0 
0 1 
0 工 1 
例 2.4.16 对 任意 XESR”, 定义 线性 映射 夏 (X) = PX 十 XP,， 其 中 了 一 
i 一 到 。 4 
( , | 试 求 矩阵 X， 使 得 TO = 人。 小 
a b 2a 一 甸 丰 = 区 
: 设 所 求 为 XX 二 = , 则 TCX) 二 PX 和 二 
解 : 设 所 求 为 X= (， ,小 则 TO0 = HP 一 (人 7 “， 
2 
为 TOO =( ); 所 以 24 一 2, 一 a 十 5 一 c 二 4,4 十 6 十 c 二 0, 解 得 a 二 1,b 一 2， 


4 
0 


< 二 一 3, 从 而 所 求 为 X= (。 “ 


当 基 改变 后 ,线性 变换 的 矩阵 是 否 也 改变 呢 ? 
设 7 为 7 维 向 量 空间 V 上 的 线性 变换 ,7 在 V 的 基 wi ,os ，……,on 和 Pp ,Pb 上 ,及 下 的 
和 矩阵 分 别 是 A 和 B， 并 且 基 Ql 0Q2 "0, 到 基 pi ,Pp ,*… ,Pp, 的 过 渡 和 矩 阵 为 P， 则 
了 (ai 2 yn ) 一 (Ci sQ2 39°"* ,0 )A 
T(P ,Pp ,一 (Bb ,应 了 一 一 (a 2 0) PB 
又 因为 
T(P ,pb 一 了 ((al 9 02， ,0 ) 卫 ) 3 了 (ai 9 012 0 (为 什么 ?) 
Ca (Or 02 0 AP 
因此 4P = 二 PB, 即 B= PAP. 
定义 2.4.4 对 nn 阶 和 矩阵 A,B, 如 果 存 在 ? 阶 可 道 矩 阵 ( 即 满 秩 和 矩阵 ) 已 ,使 得 


P'AP=B (2. 4. 12) 
则 称 和 4 与 B 相似 (similar) ,或 A 相似 于 B, , 记 为 A 二 B, 称 
Sp:ADB = PAP (2. 本 13》 


为 相似 变换 (similarity transformation) ,并 称 P 是 相似 矩阵 (similarity martrix). 
定理 2. 4.4 同一 个 线性 变换 在 不 同 基 下 的 矩阵 是 相似 的 ;反之 ,相似 的 两 个 矩阵 可 
看 成 同一 个 线性 变换 在 不 同 基 下 的 矩阵. 
若 将 线性 空间 V 中 的 线性 变换 T7 在 基 (T) 和 基 (ID 下 的 矩阵 记 为 rL 厂 ], 则 式 即 为 
[T Cx) Jr =nLT jiLx]i (2. 4. 14) 


其 中 ,Lxj 表示 x 在 基 ( 了 DD) 下 的 坐标 向 量 ,[ 厂 (x) ju 表示 x 的 像 y 二 厂 (x) 在 基 (ID 下 的 从 
标 向 量 . 特别 地 , 当 基 (了 ) 与 基 (ID) 完 全 相同 时 ,相应 的 :[ 栈 ji 就 称 为 十 在 基 (1) 下 的 矩阵 ， 
此 时 式 变 成 了 

[Ti =1[T Lx (2. 4. 15) 
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于 是 
nLT nnLxjn= [T(x) Jn( 对 基 (I1D 使 用 式 (2. 4. 15)) 
= [ZT Cx) jn 二 n[ 工 [了 T(x) ]1( 对 工 使 用 式 (2. 4. 14)) 
=n[LZjiiLT Lxji( 式 (2. 4. 15)) 
=n[ 工 j] LT LZ Cx)] 
二 nL[ 工 J [ji 1[ 了 joLxjn (对 工 从 基 (ID 到 基 (D 使 用 式 (2. 4. 14)) 
由 x 的 任意 性 , 即 得 rL7 Ja=nLZT IIL7T IILI]n. 这 显然 就 是 式 (2. 4. 12), 其中， 
[ 工 就 是 相似 抢 阵 卫 , 也 就 是 基 (CD 到 基 (II) 的 过 滤 和 矩阵 . 
例 2.4.17 考虑 民 ” 中 关于 xz 轴 的 反射 变换 ZL, 显然 姑 在 标准 基 (1):e 二 (1,0)7， 
, ). 对 于 RR 中 的 另 一 组 基 (ID :ai 一 (1,.1)7,oas 一 


1 
es 一 (1,0)T 下 的 矩阵 为 R=; a 


(1, 一 1)7, 易 知 (DD 到 (DD) 的 过 渡 和 矩阵 为 P=() ,因此 在 基 (ID 下 的 撼 阵 为 天 = 


0 
P'HP=( 


确实 有 (了 (ai), 季 (os )) 一 (olyas) 吾 .从 矩阵 表示 看 ,和 矩阵 吾 比 矩阵 瓦 ' 更 特殊 些 ( 更 接近 
单位 矩阵 ) ,这 说 明 标准 基 (J) 比 基 (II) 更 好 . 

例 2.4.18 对 多 项 式 空间 PLij; 中 的 任意 多 项 式 f(1) = zi 十 zt 十 必 妇 ,定义 线性 
变换 


= 
1 0 外 事实 上 ,由 于 Wai) 一 (1, 一 DT 一 一 必 ,(o) 一 (一 1, 一 DT 一 一 o ， 


T (CiD)) 三 (zz 十 za) 十 (zs 十 2 站 十 (zl 十 TD) 


试 求 PLt] 的 一 组 基 ,使 7 在 该 基 下 的 矩阵 为 对 角 和 矩阵 . 

解 :由 于 

7T (1) 王 了 (1 十 0 十 022) 一 (0 十 0) 十 (0 十 1 十 (1 十 0) 肆 二 0。1 十 1。: 十 1。2 

T (Ci) 一 (1 十 0) 十 (0 十 0)t 十 (0 十 1) 丰 二 1。1 十 0。zi 十 1 。 如 

T(E) 一 (0 十 1) 十 (1 十 0)z 十 (0 十 0) 丰 二 1。1 十 1。t 十 0。 如 

0 1 1 

1 0 于 | 

1 1 0 
设 所 求 基 为 fi1(2) , 户 (, 访 (， 则 7 在 其 下 的 矩阵 为 对 角 和 矩阵 4 = diagC ,hs ,23). 

由 于 同一 线性 变换 在 不 同 基 下 的 和 矩阵 相似 ,因此 有 PAP 二 A, 这 里 卫 是 过 渡 和 矩阵, 即 

CD 户 ( 访 CO) 二 (1,t,#)P. 这 样 问题 就 转化 为 求 矩 阵 A 的 特征 值 和 特征 向 量 . 


所 以 线性 变换 7 在 标准 基 1,t,t 下 的 矩阵 为 4 = 


一 名 1 1 | 1 
a=XN|= | 1 一 和 1 |=€2 2dI1 下 
1 1 一 人 1 1 一 ) 
1 1 1 
= (2—XA)|0 一 1 一 1 0 一 (2 一 人 ) (A 十 1) 
0 0 一 一 1 
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解 得 特征 值 为 A 二 2 和)2.3 三 一] (二 重 ). 


2 1 1 多 1 了 ' 
当下 三 2 时 , (4 一 MD) 王 |1 一 2 1 |~|0 一 3 3|~ 1 一 1|, 解 得 
1 Ek 2 0 0 0 0 0 0 


特征 向 量 By 人 江 > 于 y， 


, 解 得 特征 向 量 ps 二 (1, 一 1,0)"， 


I | 也 


1 1 1 0 
ii 
BB = 10, —1)T, 因 下 P= (pisB ,hs) = 1 —1 0 ， 从 而 所 求 基 为 
i 划一 


A = = 1 十? 十 六 
fe) = (08) ps = 1—t 
f3(t) = (1,F) ps = 1—¥ 


本 题 中 ,虽然 标准 基 比 f1 (2) ,f2(z) ,f(z) 形式 更 简单 ,但 后 者 的 矩阵 表示 是 最 简单 
的 对 角 和 矩阵 ,可 见 ,标准 基 未 必 一 定 是 最 好 的 基底 . 
Matlab 中 提供 了 内 置 函数 eig 用 于 计算 矩阵 的 特征 值 和 特征 向 量 , 调 用 格式 为 


[V,D] = eig (A) 


请 注意 ,返回 的 相似 矩阵 V 是 正 交 和 矩阵 ,而 对 角 和 矩阵 D 则 以 对 应 特征 值 为 对 角 元 . 
既然 谈 到 特征 值 , 那 就 让 我 们 从 变换 角度 来 考察 一 下 它 . 
定义 2.4.5 设 7 是 在 数 域 了 上 线性 空间 Y 的 一 个 线性 变换 ,如 果 存 在 人 E F 及 非 零 
向 量 wx € V, 使 得 
T(a)=Aa (2. 4. 16) 


则 称 4 为 7 的 特征 值 Ceigenvalue) , 称 非 零 向 量 @ 为 的 属于 特征 值 * 的 特征 向 量 (eigen- 
vector) ,并 称 (4, @) 为 7 的 特征 对 (Ceigenpair). 满足 式 (2. 4. 16) 的 所 有 向 量 的 集合 V;， 
即 才 属于 特征 值 4 的 全 部 特征 向 量 再 加 上 零 向 量 6, 显然 是 V 的 一 个 子 空间 , 称 为 了 的 属 
于 特征 值 的 特征 子 空间 (eigensubspace). 

显然 ,特征 向 量 & 经 过 7 变换 以 后 ,仍然 与 @ 成 倍数 关系 (倍数 就 是 特征 值 ), 即 线 
性 相关 或 “ 共 线 ” 例如 ,在 例 2. 4. 18 中 , 易 知 有 7 ( 户 ) = 二 2f1,T(fi) = 一 f2,T(f;) = 
一 3， 即 多 项 式 万 , 户 , 广 分 别 是 特征 值 2, 一 1, 一 1 的 特征 向 量 , 它 们 经 过 7 变换 后 的 像 
多项式 ) 仅 仅 是 原 像 刻 ,f; ,fs 的 常数 倍 , 即 像 仍 在 相应 的 特征 子 空 间 中 . 再 比如 对 
C” (一 o, 十 o) 上 的 微分 变换 人 DD, 显然 ,对 任意 实数 4, 都 有 D(e*) 一 人 Ae ,因此 函数 y= 
e” 是 D 的 属于 特征 值 4 的 特征 向 量 . 要 特别 注意 的 是 ,线性 变换 7 的 “特征 向 量 ” 未 必 局 
限于 C” 中 .因此 以 后 的 学 科 中 会 重新 命名 为 “特征 函数 ”等 更 具体 的 名 称 . 另外 ,这 里 的 
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线性 变换 T 就 是 例 2. 4. 7 中 提 到 的 数 乘 变换 大 . 
定义 2.4.6 对 和 矩阵 4 € C”, 如 果 存 在 1,wE C 及 非 零 向 量 x,y € C", 使 得 
Ax =Ax, yA=1y' (2.4,.17) 


则 称 X 为 4 的 ( 右 ) 特 征 值 , 非 零 向 量 x 为 4 的 属于 特征 值 的 ( 右 ) 特 征 向 量 , (4,x) 为 A 
的 ( 右 ) 特 征 对 ,满足 式 (2. 4. 17) 的 所 有 向 量 x 的 集合 ww , 称 为 4 的 属于 特征 值 的 ( 右 ) 
特征 子 空间 . 类似 地 , 称 j 为 A 的 左 特征 值 (left esigenvalue) , 非 零 回 量 y 为 4 的 属于 特 
征 值 y 的 左 特征 向 量 (left eigenvector), (jy,y) 为 4 的 左 特征 对 (left eigenpair) ,满足 式 
(2.4.17) 的 所 有 向 量 y 的 集合 V,, 称 为 A 的 属于 特征 值 j 的 左 特征 子 空间 (left eigen- 
subspace). 另外 ,和 矩阵 4 的 特征 值 的 集合 称 为 4 的 谱 (spectrum), 记 为 o(4), A 的 特征 
值 的 模 的 最 大 值 称 为 4 的 谱 半 径 (spectral radius) , 记 为 p(4). 

变换 即 和 矩阵 . 设 丁 在 线性 空间 V 的 一 组 基 wi ,oz ，…,@, 下 的 矩阵 为 4, 则 工 的 特征 值 
就 是 4 的 特征 值 .事实 上 , 设 w 在 此 基 下 的 坐标 向 量 为 x (显然 x 关 0), 则 

T (cx) =T((m G00)X) = TG OX = (01 0 0 Ax 

再 由 式 (2 入。 16) 可 知 了 (w) 一 AMC 一 从 (Qi "OQ? 9°°° 5 0)X = (Qi ,02 ,0 ) (Ax) 9 故 
Ax = Ax. 

例 2. 4. 19 对 于 Sylvester 方 程 AX 一 XB 二 C, 其 中 A、BXE RR™. 定义 Sylvester 
变换 

S$: XS(X) = AX— XB 
如 果 和 矩阵 4 .3 有 公共 特征 值 ,那么 变换 $ 是 不 可 首 的 . 
证 明 : 设 (Ny) 、 (py) 分 别 为 矩阵 A.B 的 右 \ 左 特征 对 , 即 有 Ax 一 Mr， iB 一 Pa 则 
S(xy')= A(xy')— (xy')B= (Ax)y'— x(y'B) 
一 和 iT) — pT) = A— xy.. 
如 果 存 在 某 对 4 满足 4 二 yy, 则 存在 非 零 矩阵 xy" € ker(S)， 即 dim ker(S) 关 0, 故 
dim Im(S$) = n— dim ker($) 一 7 

从 而 变换 S 不 可 首 . 

此 例 说 明 , 变 换 S 可 首 的 必要 条 件 是 矩阵 A、B 没有 公共 特征 值 . 在 例 4. 1. 4 中 ,我 
们 将 证 明 , 这 个 条 件 也 是 充分 的 . 而 S 可 道 意 味 着 像 S(X) = C 对 应 唯一 的 原 像 羡 , 即 
Sylvester 方程 有 唯一 解 . 因此 A、B 没有 公共 特征 值 也 是 Sylvester 和 矩阵 方程 有 唯一 解 的 
充 要 条 件 . 


2.4.4 线性 变换 的 不 变 子 空间 

线性 变换 7 的 特征 子 空间 w 是 一 种 特殊 的 子 空间 ,因为 它 的 像 工 (V;) 仍 在 凤 中 . 
这 样 的 子 空间 就 是 所 请 的 “不 变 子 空间 ”. 

定义 2.4.7 设 丁 是 数 域 F 上 线性 空间 V 的 线性 变换 , W 是 V 的 子 空间 . 如 果 对 
任意 向 量 a € W 都 有 TT(g) E W, 则 称 W 是 十 的 不 变 子 空间 (invariant subspace) ,并 
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称 本 在 W 上 的 部 分 即 Tw:W PW 为 丁 在 W 上 的 限制 (restriction), 即 Tw(a) 一 
T(a),a EW. 

例如 ,7 在 ker7 上 的 作用 就 是 零 变 换 口 , 而 在 V; 中 则 是 数 乘 变换 Kk. 要 注意 的 是 ， 
对 于 V 中 不 属于 W 的 向 量 7, Tw (my) 是 没有 意义 的 . 

例 2.4.20 线性 空间 V 和 零 空 间 {0) 都 是 V 上 的 线性 变换 7 的 不 变 子 空间 . 我 
们 称 V 和 {0} 为 线性 变换 T 的 平凡 不 变 子 空间 . 

例 2.4.21 线性 空间 V 上 的 线性 变换 7 的 核 空间 Ker(7) 和 像 空间 Im(T) 都 是 


7 的 不 变 子 空间 . 
进一步 地 ,可 以 证 明 ,线性 变换 7 的 不 变 子 空间 的 交 与 和 仍然 是 T 的 不 变 子 
空间 . 


有 非 平凡 不 变 子 空间 的 线性 变换 ,其 矩阵 表示 是 否 有 什么 特殊 形式 呢 ? 

设 W 是 V 的 一 个 m 维 非 平凡 不 变 子 空间 ,并 且 dimW = 二 mx; 则 0 二 m 二 n. 将 WW 
中 的 一 组 基 ww ,…,@ 扩充 成 V 的 一 组 基 ol ,os ,QQwii;Qms，… 0， 因为 
Tl(ag) E WOI= 1,2,.. ,mm), 则 


T (gi) = QQI + a0 4 “十 CC 
了 (an) 一 CQlxC1 十 aaznCs 本 Dia = 


T (aol ) 一 Ql,ozHCl 十 U2.mtH1Q2 a Se 二 thisit Orn 十 CQmHlmHlCnH 年 A 十 Dr 本 


了 (oa ) 一 ClnC1 十 CQ2nQ 2 十 UrmQ m 于 ntl ,nO mri = NE Wl 


Al1 A 
也 就 是 TT(@i ,@;，*…,@,) = (Qi ,02 ,°° ,0,) 9 这 里 
O A, 
Q11 ”Qim Ql,mtl ”” Qin Gmtlomtl “QnrHn 
鸡 一 E 二 : ， A = : 人 2 |5 Az = 
ml 2 Qon m,nrtl en Cm Qn,mtl eS [2 


定理 2.4.5 线性 空间 V 上 的 线性 变换 有 非 平凡 的 不 变 子 空间 的 充 要 条 件 是 二 在 
V 的 一 组 基 下 的 矩阵 为 块 上 三 角 矩 阵 , 即 形 如 I pal 的 矩阵 

证 明 :必要 性 已 如 前 述 ,下 证 充分 性 . 

设 T 在 V 的 一 组 基 a ,a ,…,m, 下 的 矩阵 为 块 上 三 角 矩阵 | 


(0 3 m 二 和 n). 由 了 (on sO °° >0) ES (Qi 22， 0) )A 可 知 


Aii Al; 


A EF”™” 
O | 11 € 


了 (ai 1) 二 CUC1 十 azj@2 ey (7 ] ,2,.… ,1m) 
令 W = span(@gi ,as ，…,an)， 则 W 是 V 的 一 个 m 维 子 空间 ,并 且 T(g) € W, 
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j= 二 1,2,…,m. 因此 对 W 中 的 任意 向 量 @ 二 mol 十 …… 十 zoom E W, 有 TT(g) = 
TC) 十 一 十 Xn TC(gm) E W. 根据 定义 ,并 注意 到 0 二 m 达 ,所 以 W 是 V 的 非 平 
凡 不 变 子 空间 . 证 毕 
面 对 上 述 结 # 果 ,我 们 自然 会 追问 :在 什么 条 件 下 矩阵 4 会 特殊 化 为 零 矩阵 ? 
定理 2. 4.6 线性 空间 V 上 的 线性 变换 工 在 Y 的 一 组 基 cr ,oz 00 ，， 
io 0 下 的 矩阵 为 块 对 角 珑 阵 diag{4 ,4 ,… ,A,} 的 充 要 条 件 是 V 可 以 分 解 
为 工 的 不 变 子 空间 的 直 和 , 即 


V=W.O@W:D…OW, 


这 里 ,点 阶 逢 隆 A 《和 十 包 十 … 十 名 一 如 ) 为 限制 厂 |w 在 相应 基 @10 ,aio sa 下 
的 矩阵 ,，;z 二 1 ,2,*… ,5s. 

证 明 :必要 性 . 设 丁 在 V 的 一 组 基 a1 ,02 ,00 A 02" ey 0 下 的 和 矩 
阵 表示 为 块 对 角 矩 阵 diag{Ai1,As,…,A,}). 令 页 一 span(o ,oo po ) 1 二 |， 
2, ,5， 则 


Ta” ,0 0 ) = (CI ,0 ,0 ) A; 
因此 开 (@j”) € W:;, 7 1 “, ki, 从 而 Wi; 是 7 的 不 变 子 空 s 间 ， 并 且 
V=W 中 W: 中 … OW, 


充分 性 . 设 V 可 以 分 解 为 7 的 非 平凡 不 变 子 空间 的 直 和 ，, 即 V 二 Wi 申 太 : 申 … 申 
Ws 在 W， 中 取 一 一 组 基 @i 2 ,az »""" Qk 9 则 由 定理 2. 3. 9 可 知 oa oz yi ges 
1 ,C2 0 为 V 的 一 组 基 . 因为 W 的 涉 开 于 这 他 新 此 Ta Qe" ,ee 
ou ) 一 (oO ,oz 0 ) A;, 于 是 


(1) (Ey (1) (s) (s) (s) 
T (ai » 0 OA a ,0 0 ) 


= = (@i (1) Qa Qe 1 sO 0 ) diag(Al ;A» ,A,) 


证 毕 . 

根据 定理 2. 4. 6, Y 的 基 是 由 各 非 平凡 不 变 子 空间 Wi; 的 基 合 并 而 成 的 . 考虑 到 十 的 
特征 子 空间 也 是 不 变 子 空间 ,因此 上 述 A; 可 取 为 十 的 特征 子 空间 . 特别 地 ,我 们 有 如 下 
推论 : 

推论 :n 维 线性 空间 V 上 的 线性 变换 十 在 V 的 某 组 基 下 的 矩阵 为 对 角 和 矩阵 
diag{ 和 ,A2，… ,hs) 的 充 要 条 件 是 V 可 以 分 解 为 赴 的 个 一 维特 征 子 空间 的 直 和 
VV 二 Vi 四 田 … 田 吏 ,， 这 里 罗 ,和 ，…, 胃 ,为 十 的 非 亏损 特征 值 , 即 代数 重 数 等 于 
几何 重 数 的 特征 值 . 

例 2.4.22 求 R? 中 和 矩 阵 4 所 对 应 的 线性 变换 二 的 所 有 非 平凡 不 变 子 空间 ,其 中 
和 矩阵 
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解 : 例 2.4. 18 中 已 求 得 特征 值 41 = 2 = 和 3 二 一 1 及 对 应 的 特征 向 量 
pi 二 KITT ps = (1s = .1DT, ps = 10, CO— 1)7 
因此 工 的 所 有 非 平 几 不 变 子 空间 为 V1. Vs，, 这 里 
Vi= {api},Vs = {cpst+cpa}sacscs E R 


由 定理 2. 4.6 可知 R’ = Vi 四 也. 
特别 地 ,特征 值 一 1 的 代数 重 数 等 于 儿 何 重 数 , 因 此 一 1 是非 亏损 特征 值 . 若 令 


Va = {kip2} Vz = {kz ps} 
则 成 立 V; = Va OV 以 及 R’ = Vi DVa 中 Va. 


2.5 和 矩阵 的 Jordan 标准 型 


从 逻辑 上 看 ,标准 型 的 理论 源 自 矩阵 的 相似 性 ,因为 相似 矩阵 有 许多 相似 不 变量 ; 特 
征 多 项 式 、 特 征 值 (包括 代数 重 数 和 几何 重 数 ) ,行列 式 、 迹 及 秩 等 ,并 且 特 征 向 量 也 可 以 
昔 助 于 可 逆 的 相似 变换 矩阵 互相 求 出 . 这 自然 导出 了 寻找 相似 和 矩阵 集合 中 的 “代表 和 矩阵 ” 
的 问题 .“ 代 表 和 矩阵 当然 越 简单 越 好 . 对 于 可 对 角 化 矩阵 ， 代 表 和 矩阵 ?就 是 特征 值 组 成 的 
对 角 和 矩阵 . 但 是 令 人 非常 遗憾 的 是 :一 般 和 矩阵 未 必 与 对 角 和 矩阵 相似 ! 因此 我 们 只 能 “ 退 而 
求 其 次 ”, 寻 找 “ 几 乎 对 角 的 ”矩阵 . 这 就 引出 了 矩阵 在 相似 变换 下 的 各 种 标准 型 问题 ,其 
中 Jordan 标准 型 是 最 接近 对 角 的 矩阵 ,因为 除了 对 角 元 之 外 , 它 只 在 第 1 条 对 角 线 上 另 
取 1 或 0. 弄 清楚 了 矩阵 相似 的 本 质 , 理论 上 .计算 上 以 及 应 用 上 的 许多 问题 就 容易 处 理 
了 ,当然 复杂 度 也 大 了 . 


2.5.1 从 算术 基本 定理 到 Jordan 标准 型 


我 们 知道 ,360 的 素 因 子 有 2,3,5, 并 且 360 = 23 X 3? X5. 一 般 地 ,对 于 整数 ” 我们 
有 算术 基本 定理 :7 三 士 加 Xp 实 X…Xpw”. 对 于 多 项 式 , 高 斯 在 博士 论文 中 证 明了 代数 
基本 定理 , 即 任何 复 系数 一 元 n 次 多 项 式 f(z) 在 复数 域内 有 且 只 有 个 根 ( 重 根 按 重 数 
计算 ) ,也 就 是 


f(z) 一 Darz* = (2 一 (十 度 一 70) 


定理 2.5.1 设 V 是 复数 域 C 上 的 线性 空间 ,三 是 V 上 的 线性 变换 . 令 在 V 的 一 
组 基 下 的 矩阵 表示 为 4， 如 果 4 的 特征 多 项 式 p(4) 一 | 一 4| 可 分 解 因 式 为 
p00) = QA" 八 一 委 ) AA)™ (mmt 二 mn (2.5.1) 
则 VV 可 分 解 成 不 变 子 空间 的 直 和 , 即 
V= NO®N;:0O…N, 
这 里 入 二 Ker((T 二 如 TY 
对 比 定理 2.4. 6 可 知 ,这 里 选择 的 一 组 不 变 子 空间 是 N,, 其 中 的 (一 4 工 )”" 表示 
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的 是 变换 ( 栈 一 A 工 ) 的 m; 次 寡 . 我 们 称 子 空间 NN; 为 根子 空间 (root subspace) 或 广义 特 
征 子 空间 (generalized eigensubspace). 

适当 选取 根子 空间 N; 的 基 ( 称 为 Jordan 基 ,Jordan basis) ,根据 定理 2. 4. 6, 每 个 子 
空间 的 Jordan 基 合 并 起 来 即 为 V 的 Jordan 基 , 并 且 7 在 Y 的 此 Jordan 基 下 的 和 矩阵 ,为 
块 对 角 阵 


J = diag(CJi Ci) JJ)) 42 5 2) 
其 中 ， 
A: 1 
起 7 
Ji = 二 二 1 29) (2, 5. 3) 
Ai 


我 们 称 J 为 4 的 Jordan 标准 型 (Jordan canonical form 或 Jordan normal form)， 
Ji(A;) 为 m; 阶 Jordan 块 (Jordan block). 
要 注意 的 是 ,与 式 (2. 5. 1) 不 同 的 是 , 式 (2. 5. 2) 中 的 特征 值 可 以 相等 . 另外 ,为 避免 
繁 元 的 表述 ,我 们 也 将 对 角 元 为 的 & 阶 Jordan 块 记 为 J (4). 请 读者 根据 上 下 文 加 以 
甄别 . 
定理 2.5.2 设 4 EJ”. 如 果 4 的 特征 多 项 式 p() = | 虹 一 4| 可 分 解 因 式 为 式 
(2. 5.1), 则 4 经 过 相似 变换 可 化 成 唯一 的 Jordan 标准 型 (不计 Jordan 块 的 排列 次 序 )， 
即 存在 可 逆 矩 阵 己 E F* ( 称 为 Jordan 变换 矩阵 ,Jordan transformation matrix) 使 得 
PTI4P 王 ,/ (2. 5. 4) 
即 4 有 Jordan 分 解 (Jordan decomposition) 
A = PJP"' C2. 5. 5 


把 A 的 同一 个 特征 值 的 若干 个 Jordan 块 依次 排列 成 块 对 角 和 矩阵 ,就 得 到 Jordan 标 
准 型 
Ja= diag(Ai(X1) As) AN)) (Ca 十 到 十 …… 十 到 一 7 (2.5.6) 


其 中 , A;(4;) 是 n; 阶 的 Jordan 子 矩 阵 (Jordan submatrix) ,包含 个 阶 数 分 别 为 n; 的 
Jordan 抉 (ni 十 nz 十 … 十 na 二 n;), 即 


A,; (1;) 一 一 : diag(J GD) Ji ,es Ti (A;)) (1 = 1 ,2," ,1) 


2.5.2 Jordan 标准 型 的 简易 求法 


先 介绍 一 种 简易 求法 . 我 们 结合 图 2 - 19 来 进行 分 析 . 

在 图 2- 19 中 , 4; (Ci ) 是 由 3 个 ( 即 已 = 3 ) 阶 数 分 别 为 mi ==1,n 一 2,mm3 一 5 的 
Jordan 块 Ji) ,TM1) ,Js (A1) 构成 的 块 对 角 和 矩阵 ,其 阶 数 Mm = mT ns 十 ns 一 8， 事 
实 上 , nm 就 是 特征 值 4 的 代数 重 数 . 
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加 到 ey 和 
je =2) 


| 
人 
人 
| 
| 
四 的 
| | 


DPD po 本 ES) 
ED 了 全 pe Rp mE oe) 


Du 


= Ai(4,) 


(1) (ms =5) 


图 2-19 Jordan 子 矩阵 的 结构 示意 图 


根据 Ja 的 结构 ,将 Jordan 变换 矩阵 P 列 分 块 为 P= (pi ;Pas°"*» Di), 其 中 p:; 是 
n Xn; 阶 的 矩阵 .由 4P 三 PJ, 可 知 Ap; = pi;A;(;). 
进一步 ,根据 A; (4;) 的 结构 ,将 p; 列 分 块 为 p; 二 (pa ,pi ,pz ) 其 中 pj; 是 n Xn; 
阶 的 矩阵 Gj 二 1,2,…,ki). 由 Ap; 二 piA;G0), 可 知 Aps = ps J;(0). 
在 图 2-9 中 ,pi 二 (pu,pwzspss) 是 nX8 阶 矩阵 ,其 中 pi 是 2X1 阶 矩阵 ,ps 是 
nnX2 阶 和 矩阵 ，pis 是 nX5 阶 和 矩阵 . 
最 后 ,根据 Jj; Ci) 的 结构 , 设 p; 二 (CPP pp 的 )). 由 Ap; 二 pyJj(4;) 可 知 
(A—AI) py =0 
(4 一 NTD py = py 
(2. ©, 人 


(AC— AT) py Ed = py 


解 这 个 方程 组 ,可 得 Jordan 链 (Jordan chain) {py ,py ,的 2 这 个 名 称 也 可 以 
这 样 理解 : 


其 中 , py” 是 和 矩阵 A 关于 特征 值 4; 的 一 个 特征 向 量 , p 闻 ,… ,p98 则 被 称 为 4; 的 广义 特 
征 向 量 (generalized eigenvector) ,而 问 量 py%?’ 被 称 为 4; 的 nn; 级 根 向 量 (root vector). 可 
以 证 明 , 由 这 些 Jordan 链 拼 成 的 向 量 组 是 线性 无 关 的 . 

在 图 2- 19 中 ,存在 3 个 Jordan 链 : {pf }, {p 维 ,p), {p 委 ,pf ,pf ,pf , pf)， 
其 中 , pi 、pf2 和 pi3 是 特征 值 和 的 3 个 线性 无 关 的 特征 向 量 ,余下 的 5 个 向 量 都 是 特 
征 值 A te pi 、pi2? 和 ps3 分 别 是 特征 值 的 1 级 .2 级 和 5 级 的 根 
向 量 . 

特征 值 ;的 几何 重 数 就 是 A;(4;) 中 Jordan 块 的 个 数 ,也 就 是 特征 值 % 对 应 的 Jordan 链 
的 个 数 , 亦 即 4; 对 应 的 线性 无 关 特 征 向 量 的 最 大 个 数 . 

显然 , 当 所 有 的 二 1 时 ,有 ; 二 ni, 此 时 和 矩阵 没有 广义 特征 向 量 ,特征 值 ;都 是 非 
亏损 特征 值 , p; 的 各 列 都 是 4; 的 线性 无 关 的 特征 向 量 , 因 此 Jordan 块 万 人) 都 是 1 阶 
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的 ,此 时 Jordan 标准 型 为 
Ja 一 diag{Al 9 ,Ai 人 2 9 9 人 2 和 ,人 eg 3 


ne 


即 和 矩阵 A 是 可 对 角 化 矩阵 (diagonalizable matrix) ,其 Jordan 分 解 特 殊 化 为 谱 分 解 (spectral 
decomposition) 或 特征 值 分 解 (eigendecomposition) , 即 

4 一 PAP- (2. 5.8) 

其 中 ,对 角 和 矩阵 一 般 表 示 成 从 = diag( A1 M2 AD)， 这 里 Ai sho ss on 为 矩阵 A 的 特 


征 值 . 
例 2.5.1 求 矩 阵 4 的 Jordan 标准 型 Ja 及 相应 的 Jordan 变换 矩阵 已 , 其 中 


= 上 1 0 
4 一 | 一 4 3 0 (2. 5. 9 
1 © 2 


41(2) 
解 :4 的 特征 值 为 41 二 2,3 一 1, 故 设 J4 二 A | 
特征 值 二 2 为 单 根 , 故 A1(2) = 二 2, 且 从 (4 一 2Dx 二 0 可 得 对 应 的 特征 向 量 为 


ai = (0,0,1).. 
对 于 二 重 特征 值 %2,; 二 1, 由 (4 一 Dx 一 0 只 解 得 唯一 的 特征 向 量 m= 
(1,2, 一 1)', 故 特征 值 2.; 二 1 是 亏损 特征 值 ,存在 广义 特征 向 量 ,此 时 As(1) 中 只 有 1 


4 二 
信 Josdan 块 , 即 A,(1y 二 (, 求解 非 齐 次 线性 方程 组 (A 一 Dp = o, 可 得 所 需 的 广 


义 特 征 向 量 为 B= 二 (0,1, 一 1)5. 
综合 上 述 ,可 得 


2 0 0 0 1 而 
Ja=|0 1 1,P=(gm asp)=|I0 2 1 (2. 5. 10) 
0 0 1 二 一 站 一半 


Matlab 的 内 置 函数 eig 能 求 出 所 有 特征 值 ,但 却 不 能 求 出 广义 特征 向 量 ( 为 保证 程 
序 可 运行 ,Matlab 填充 以 相应 的 特征 向 量 ). 好 在 Matlab 后 来 提供 了 内 置 函 数 jordan, 其 
调用 格式 为 

[V,J]= jordan (A) 
注意 返回 的 相似 变换 矩阵 Y 未 必 是 正 交 和 矩阵 . 
例 2.5.2 用 Jordan 标准 型 理论 求解 线性 微分 方程 组 
ZX1(t) 一 一 /十 zs 


6) 一 == 十 3zz 


ZX3(1) = zl 十 2z3 
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解 : 令 X 一 (zyzyz)Tz CD) 一 (CCD ,zs ,x3(1))7, 则 方程 组 的 矩阵 形 
式 为 
(的 = 人 
其 中 , 4 即 式 (2. 5. 9). 由 上 一 题 知 A 的 Jordan 分 解 为 4 = PJaP71i, 这 里 J 及 己见 式 
(2.5. 10), 因此 x (1) = PJP-x, 也 就 是 Pix (1) = 二 JaP 7"'ix. 注意 到 PT (Ci = 
(P11ix(1))', 通过 线性 变换 y 二 Pinix, 显然 可 将 方程 组 变形 为 
y (2 = Jay 
邻 y 二 (yi,yz,y3)'， 则 原 方程 组 等 价 于 下 列 微 分 方程 组 
V(t) = yi yy2(0) = yt ys y(t) = ys 
解 得 yi 二 cie*, yz 二 cze!' 十 C3te', 一 ce 从 而 由 可 逆 线 性 变换 = Pix 即 
x 二 Py, 可 得 原 方程 组 的 解 
Kil=e er 
wa) = es el cs (2 Ler 
zat)=e es cye! cslz | le 
Matlab 提供 了 内 置 函数 dsolve 用 于 求解 符号 微分 方程 的 符号 解 . 本 题 的 调用 格 
式 为 


[Xx1, xX2,xX3]= dsolve('Dxl= — 1* xl1+ x2','DX2= 一 4* xl1+ 3* x2','Dx3= xl+ 2* x3) 
当然 ,返回 的 结果 与 手 算 未 必 完 全 相同 . 
例 2.5.3 在 现代 控制 理论 中 ,线性 定常 系统 (Linear Time Invariant ,LTI ) 的 状 
态 空间 描述 为 
| = Ax 二 Bu 


yy 一 Cr 十 Dr 


这 里 ,矩阵 A 表示 系统 内 部 状态 变量 之 间 的 联系 , 称 为 系统 矩阵 ;矩阵 B 称 为 输入 矩阵 或 
控制 矩阵 ;和 矩阵 C 称 为 输出 天 阵 或 观测 矩阵 ;矩阵 了 称 为 直接 观测 矩阵 . 此 系统 可 简 记 为 
(A,B,C.,D). 


对 系统 做 可 逆 线 性 变换 x = 二 Pn"'x, 则 
| 一 Pix= PiAPP'ix+PiBy = AxX + Bu 


y= CPx + Du = Cx Du 


其 中 , A 二 P'A4P,B= 二 P'B,C= 0P,D=D. 
显然 ,对 任意 方 阵 4 而 言 ,最 简单 的 A 就 是 A 的 Jordan 标准 型 por 
变量 间 的 完全 解 耦 ,但 也 达到 了 可 能 达到 的 最 简 耦 合 形式 . 因此 线性 变换 就 是 状态 
间 的 基底 变 变换 , 即 通 过 将 系统 (4,B,C,D) 变换 成 等 价 的 系统 (4,B,C,D)， 以 寻找 描述 
同一 系统 的 运动 行为 的 尽 可 能 简单 的 状态 空间 描述 . 
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求 下 列 状态 方程 的 Jordan 标准 型 : 
0 1 0 0 
rx=Axr+Bu=|0 0 lz+lolu 
2 3 0 1 
解 :计算 可 得 4 的 Jordan 分 解 为 4 = 二 PJAP-, 这 里 
1 LL 1 一 曙光 


4 1 -1 全 看 一 1 
因此 经 过 可 道 线性 变换 x 二 Pixz 后 ,系统 矩阵 4 和 控制 矩阵 好 分 别 变 成 了 
1 名 ym Oni 1 1 2 0 0 
A—PiAP—3|2 5 | 0 hl i l= -1 了 | = 了 
6 3 = 员 芝 是 远 1 = lo 6 1 
1 2 11i7 2 
B=P*B=4l2 5 2|1lol= 工 -1 
9 9 
6 3 = 1 


注意 :此 题 中 pg) 二 | 一 A| 二 一 0X 一 34 一 2, 不 考虑 最 高 次 项 系数 1, 剩 下 的 
三 个 系数 的 相反 数 , 按 升 军 顺序 ,正好 就 是 矩阵 A 最 后 一 行 的 三 个 元 素 , 故 矩阵 4 称 为 特 
征 多 项 式 pg(4) 的 友和 矩阵 (companion matrix). 

例 2.5.4 求 矩 阵 A 的 Jordan 标准 型 J 及 相应 的 Jordan 变换 矩阵 已 , 其 中 


一 1 一 1 一 2 —2 


A1(0) 
解法 一 : A 的 特征 值 为 A! = 0,42.3. 一 一 1, 故 设 J 一 ch 


因为 特征 值 A 三 0 为 单 根 ,所 以 A1(0) = 0, 并 可 从 (4 一 0Dx 二 0 解 得 对 应 的 特征 


向 量 为 @i = 人 下， 一 2)7 
对 于 三 重 特征 值 1 二 一 1, 由 (4 十 Dx 二 0 可 解 得 两 个 特征 向 量 为 


Q2 一 (1s0,0, Ne 1) 7 ,os ES G01 0; LT 


因此 A;( 一 1) 中 有 两 个 Jordan 块 , 即 
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1 


| = 


= 1 
= 


或 4,;( 一 1) 二 


= 


求解 (4 十 DB= os ,无 解 ! 这 让 人 不 禁 胸口 一 紧 . 换 ws 试 试 ,求解 (4 十 DB = os ,可 
得 所 需 的 广义 特征 向 量 有 = (一 1,0,1,0)7. 有 惊 无 险 ,虚惊 一 场 ! 


综合 上 述 , 可 得 
= @ -4 0 
-Wp ls § 1 一 
> Qi ,0 ,0 ,Bb ] 0 0 J yA ~ | i 
一 包 一 一 上 灿 | 


注意 : (1) 由 于 特征 向 量 和 广义 特征 向 量 的 取 法 不 唯一 ,因此 相似 变换 矩阵 了 不 唯 
一 . 但 注意 ,不 计 特 征 块 的 排列 顺序 ,Jordan 和 矩阵 J 是 唯一 的 . 

(2) 要 特别 当心 的 是 ,本 题 中 如 果 选 取 三 重 特征 值 42,3, = 一 1 的 特征 向 量 为 

oz = (1,0,0,—1)T,@g = (1,—1,0,0)7 

则 (4 十 DB 二 @; 和 (A 十 DB== a;' 都 无 解 . 这 说 明 在 选取 特征 值 %; 的 &; 个 特征 向 量 p 负 ， 
py ,… ,pa 时 ,前 述 求法 存在 问题 ,显然 有 待 深化 . 

如 何 解决 这 种 问题 呢 ? 一 种 解决 办 法 是 取 Q = ki@; 十 ko@s 一 (有 十 ,一 kz,0， = 一 由 js 
并 适当 选取 待定 系数 & , 心 , 使 得 (A 十 DB 二 a 有 解 . 由 于 


1 1 1 1 ki 十 直下 于 于 0 


2 2 3 2 —k; 0 6， 一 局 
(A 十 I,a) = ~ 
1 1 1 1 0 0 .00 0 A 十 忆 
1 1 2 1 ki 0 0 0 0 0 


因此 十 ks 三 0 时 方程 组 有 解 . 不妨 取 k 二 一 ks 二 1, 得 @ 二 @ 一 (0,1,0, 一 1)7. 
以 下 同 前 , 略 去 . | 

例 2.5.2 Jordan 标准 型 的 一 般 求法 . 

设 7 为 复方 阵 A 的 特征 值 ,其 代数 重 数 为 cr, A 为 使 得 等 式 


rank (A—A1)* = rank (4 一 1 了 TD) 针 1 《2. 5. 11) 
成 立 的 最 小 正 整 数 ( 称 为 特征 值 4; 的 指标 Cindex) ) ,即使 得 
(A—AT)rz =0,(4—AD TxA0 (2..9, 12. 


有 非 零 解 的 最 小 正 整数 . 
根据 前 面 的 分 析 , 4; 的 指标 & 就 是 4; 的 最 大 Jordan 块 的 阶 数 . 
Jordan 标准 型 的 一 般 求法 如 下 : 
(1) 规 定 mm = n. 计算 7 二 rank (4 一 1)T,t=0,1,2,…; 
(2) 计 算 d 寺 7 一 74yt 二 135sk 十 15 直至 出 现 din 二 0; 
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(3) 计 算 8 三 双 一 da = 1,2,…,k. 

按 此 计算 出 的 8 就 是 上 阶 Jordan 块 J,(2;) 的 个 数 . 不 计 顺 序 ,就 唯一 确定 了 Jordan 
标准 型 . 

至 于 相应 的 子 和 矩阵 p; 的 构造 ,我 们 通过 一 个 例子 来 说 明 . 假定 ?二 10,c 二 8, 一 4， 
= =4 n=n= Ns = d=,d = ,d= 1,d = 1 =0, cA 而 6 = 0, 
中 二 2,6; 二 0,6 二 1. 因此 矩阵 有 1 个 4 阶 Jordan 块 厂 (0) 和 2 个 2 阶 Jordan 块 JQ;). 

取 pa 满足 式 (2. 5. 12), 则 可 得 最 长 的 Jordan 链 {(4 一 1D3 pa, (A 一 AD? pa, (CA 一 
XA) pa ,pa}. 对 于 另外 两 条 长 为 2 的 Jordan 链 ,可 选取 为 {(A 一 1D pz,pz) 和 1{(A 一 A,T) 
pa ,pa), 这 里 pa ,pw ,pi 线性 无 关 , (A 一 1D) 天王 0 且 (4 一 1D pi 关 0, /= 2,3. 

此 方法 的 证 明 可 参见 文献 L16]. 下 面 用 这 种 方法 重 解 例 2. 5. 4. 

解法 二 :对 于 三 重 特征 值 Nh2.3,4 一 一 ]， 计算 可 得 ro 4 ,ni 2 ors rs 1 sk 2， 
dy = = 1 = 0 = ly = 1. 

解 (A4 十 Dix= 二 0, (4 十 Dx 关 0, 得 非 零 向 量 厅 = (1,0, 一 1,0)7, 从 而 得 最 长 的 
Jordan 链 


(A+DB= C0,—1,0,1)7,8 = (1,0,—1,0)7 
解 (4 十 DiIx= 王 0, 得 非 零 向 量 w = (1, 一 1,0,0)7. 显然 ms, 线性 无 关 . 
一 了 了 0 1 


= , ==1 
|. 验算 可 知 


2.5.3 Jordan 其 人 


Jordan 其 人 ,说 的 是 Jordan 标准 型 的 提出 者 卡 米尔 ， 
约 当 (Camille Jordan, 见 图 2- 20). 数学 史上 有 好 几 位 约 
当 , 个 个 都 惊 才 绝 艳 ,让 人 难以 超越 . 比如 有 些 学 者 将 矩 
阵 化 成 行 阶梯 型 的 过 程 称 为 高 斯 消 元 法 ,而 将 矩阵 化 成 
行 最 简 型 的 过 程 称 为 高 斯 - 约 当 消 元 法 ,这 里 的 约 当 就 是 
男 一 位 测量 技师 威廉 ， 约 当 (Wilhelm Jordan, 1842 一 
1899) ,这 个 成 果 发 表 于 1888 年 ,来 自 于 他 试图 寻找 方法 
以 极 小 化 测量 数据 的 平方 误差 的 工作 . 另 一 位 约 当 更 是 
了 不 得 ,他 就 是 理论 物理 学 家 和 数学 物理 学 家 帕 斯 库 尔 
* 约 当 (Pascual Jordan,1902 一 1980) ,量子 力学 的 主要 创 
立 者 ,Jordan 代数 的 发 明 者 , 曾 被 提名 为 诺 贝 尔 奖 得 主 . 
关于 他 , 曹 天 元 的 ( 上帝 撕 散 子 吗 :量子 物理 史话 ) 里 有 段 ”图 2-20 卡 米尔 约 当 (1838 一 1922) 
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精彩 的 “ 饭 后 闲话 ”可 是 在 物理 上 ,他 完全 笼 置 在 玻 恩 和 海 森 堡 的 耀眼 光辉 之 中 , 而 在 数 
学 上 的 知名 度 , 则 远 逊 于 卡 米 尔 。 约 当 . 不 过 这 完全 可 归结 于 他 答 由 自 取 , 谁 让 他 当初 同 
情 纳粹 ,而 且 战 后 还 支持 政府 拥有 战术 性 核武 器 ,从 而 与 大 多 数 原子 物理 学 家 的 主张 背 
道 而 驰 . 卡 米 尔 。 约 当 的 父亲 和 锚 锚 都 毕业 于 巴黎 综合 理工 学 院 ( 即 X), 久 田 夏 几 纳 
(Puvis de Chavannes,1824 一 1898) 后 来 成 了 象征 主义 绘画 的 代表 人 物 . 1855 年 , 卡 米尔 循 
着 父辈 的 足迹 ,进入 X 攻 读数 学 ,1861 年 博士 毕业 ,次 年 归 了 里 昂 副 市 长 之 女 为 妻 . 同 那 个 
时 代 大 多 数 数 学 家 一 样 ,他 以 工程 师 为 业 . 1876 年 起 他 被 聘 为 X 的 教授 . 

卡 米尔 几乎 涉 狂 了 当时 所 有 的 数学 研究 领域 ,这 从 他 的 文集 可 以 看 出 . 文集 前 两 卷 
的 主题 是 有 限 群 ,第 三 卷 涉及 线性 和 多 重 线性 代数 以 及 数论 ,第 四 卷 则 涉及 多 面体 的 拓 
扑 、 微 分 方程 以 及 机 械 力学 . 他 在 有 限 群 上 的 贡献 最 大 ,可 以 说 是 系统 论述 有 限 群 的 第 一 
人 ,为 有 限 群 理论 的 形成 做 出 了 很 大 的 贡献 . 他 1870 年 出 版 的 4 代 换 论 及 代数 方程 论 ) 成 
为 几 十 年 内 的 经 典 之 作 . 在 该 书 中 ,他 提出 了 和 矩阵 的 Jordan 标准 型 ,并 将 伽 罗 瓦 的 置换 群 
理论 纳入 到 数学 的 中 心理 论 之 中 . 受 当 时 晶体 结构 研究 的 影响 ,他 将 群 理论 引入 到 几何 
之 中 ,并 考虑 了 欧 几 里 得 变换 群 的 分 类 问题 . 这 吸引 了 李 (Sophus Lie,1842 一 1899, 李 代 
数 的 发 明 人 ) 和 克 莱 因 (Felix Klein,1849 一 1925,1872 年 发 表 了 意义 深远 的 “ 埃 尔 朗 根 纲 
领 ”) 等 青年 才 俊 的 登门 拜访 . 后 来 他 还 证 明了 素 因 子 置 换 群 和 有 限 性 定理 . 

尽管 他 不 知晓 莫 比 乌 斯 (August Ferdinand M6bius,1790 一 1868, 莫 比 乌 斯 带 的 发 现 
者 ) 的 工作 ,但 他 以 自己 掌握 的 黎 曼 的 成 果 为 基础 ,在 1866 年 引入 了 许多 拓扑 概念 ,诸如 
同 伦 路 径 .曲面 的 同 伦 群 ,等 等 . 他 在 《分 析 教 程 》(1882 一 1887) 中 提出 的 约 当 曲线 定理 ， 
即 平面 上 的 任何 简单 团 曲 线 都 把 这 平面 分 成 两 个 区 域 ( 内 部 和 外 部 ) ,如今 更 是 闻名 退 
还. 他 还 在 该 书 中 定义 了 曲线 的 长 度 . 众所周知 ,这 本 书 为 如 今 的 分 析 学 教科 书 设 定 了 基 
调 . 有 意思 的 是 ,大 约 60 年 前 , 柯 西 的 4 分析 教程 》 也 为 如 今 的 高 等 数学 教科 书 树 立 了 蓝 
本 . 他 们 面 对 的 ,可 都 是 X 的 学 生 , 即 毕业 后 以 民事 和 军事 工程 师 为 职业 的 学 生 . 


在 线性 代数 中 ,我 们 已 接触 过 方 阵 高 次 害 计 算 的 多 种 方法 ,如 归纳 法 、 二 项 展开 式 
法 ` 行 乘 列 法 ,但 它们 处 理 的 大 都 是 特殊 矩阵 的 高 次 索 . 利用 特征 值 分 解 可 以 计算 可 对 角 
化 方 阵 的 高 次 需 , 而 利用 Jordan 分 解 则 可 以 计算 任意 方 阵 的 高 次 宕 . 


2.6.1 从 两 个 例子 说 起 


计算 方 阵 A 的 任意 次 备 A”" 是 和 矩阵 分 析 与 计算 中 的 基本 问题 . 口 说 无 赁 , 效 举 两 例 
为 证 . 

例 2.6.1 (马尔 科 夫 链 ) 设 某 小 城市 共有 30 万 人 从 事 农 . 工 . 商 三 业 . 假定 这 个 总 
人 数 始终 保持 不 变 . 社会 调查 显示 : 

(1) 目前 有 15 万 人 务农 ,9 万 人 务工 ,6 万 人 经 商 ; 

(2) 在 务农 人 员 中 ,每 年 约 有 20% 改 为 务工 ,10% 改 为 经 商 ; 

(3) 在 务工 人 员 中 ,每 年 约 有 20% 改 为 务农 ,10% 改 为 经 商 ; 

(4) 在 经 商人 员 中 ,每 年 约 有 10% 改 为 务农 ,10% 改 为 务工 . 
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试 分 析 从 事 这 三 种 职业 的 人 员 总 数 的 变化 趋势 . 
若 用 向 量 @; = (zy 过) 表示 第 ;年 后 从 事 这 三 种 职业 的 人 员 总 数 , 则 初始 向 量 为 
oo 二 (15,9,6)'. 根据 题 意 ,1 年 后 从 事 这 三 种 职业 的 人 员 总 数 应 为 
Xi 一 0. 7zo 十 0.2yo 十 0. lzo 


二 0, 和 2 a 0. 7yo 二 人 lzo 


~ 一 0. lx6 TT 0. lyo 十 0， 8xo 


[| 
写成 矩阵 形式 , 即 w 二 4xu, 这 里 A 二 10.2 0.7 0.1| 称 为 迁移 矩阵 (transfer matrix). 
Ol 必 工 me 


同 理 可 知 , @; 一 hg 一 4?oo, os 一 A 一 hi@o, 一 般 地 ,我 们 得 到 马尔 可 夫 链 
(Markov chain) : 
0 = Aao (n=1,2,3,.") 《2. 6. 1) 
“ 阿 吐 ! 哎 , 这 不 是 4" 嘛 ? 这 不 是 47 嘛 1”( 严 顺 开 ( 张 三 其 人 》) 
例 2.6.2 (线性 滤波 器 ) 在 数字 信号 处 理 中 ,可 以 用 如 下 的 阶 线性 差分 方程 来 描 
述 一 个 线性 滤波 器 ( a。 和 a, 不 为 零 ) : 
SA (2. 6. 2) 
其 中 , ao 通常 为 1, 序列 {y% } 代表 输入 信号 ,序列 {zi ) 则 代表 输出 信号 . 当 {x )} 是 零 序 
列 时 , 即 
0 = aoyetr + dei TT i + Ary (2. 6. 3) 
称 方程 (2. 6. 3) 为 n 阶 线性 齐 》 St eae be 被 变换 为 零 信 和 号 


例如 ,对 二 阶 线性 齐 次 滤波 器 0 = 3 十 于 pe 当 输 入 连续 信号 y 一 
s( 立 4 ) 的 整数 采样 ! 入 “yo 一 1， 于 1， LE 一 上 上， ] 9 U 
CO yi} y 入 启 ， 0 遍 1 万 0,，……} 


ep } 就 是 零 序 列 ,这 说 明 信 号 {yi } 被 过 滤 掉 了 . 
设 方程 (2. 6. 3) ae 瓦 , 定义 五 到 R” 的 线性 映射 
T :1 HGCyyyiyy ye) 
可 以 证 明 7 是 一 个 同 构 映 射 ,因此 互 是 一 个 线性 空间 , 且 dimH = dimR” 一刀 
方程 (2. 6. 3) 的 一 种 解法 是 降 阶 法 , 即 用 等 价 的 一 阶 差分 方程 组 来 代替 它 . 事实 上 ， 


若 令 
0 1 0 0 
yk 
0 0 0 0 
.YAHI 
Xk ~ 9 一 一 
0 0 0 1 
.YAHzr-1 
Cn Cl 2 Ql 
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则 方程 (2. 6. 3) 就 转化 为 mn 二 Axi， 注意 这 里 的 A 正 是 多 项 式 f(z) 一 w 十 arZ 十 … 十 


=i 


CT Ww 的 友和 矩阵 . 显然 Xe 一 Fi 一 全 Xe2 一 = A* Xo. “你 看 这 是 不 是 高 次 窜 啊 ?” 


2.6.2 Jordan 分 解法 

由 A 的 Jordan 分 解 A 二 PJP 可知 ， 

A"= (PJP™) PJP ):…(PJP) = PJ (PNP)JPP)J:…(P "PJP 
= PJ"P" 

即 4 一 卫 广 PP (2. 6. 4) 

这 样 ,一 般 的 高 次 寡 4" 的 计算 就 转化 为 特殊 的 高 次 寡 , 太 的 计算 . 

特别 地 , 当 A 特殊 化 为 可 对 角 化 矩阵 时 ,和 矩阵 了 就 特殊 化 为 对 角 和 矩阵 4, 从 而 有 

A” = ,PA"P'! (2, 6, 5) 


例 2.6.3 求 矩 阵 4 的 和 矩阵 多 项 式 f(4) = 二 45 一 1A 十 6 A 一 6A? 十 64 一 31, 其 
中 和 与 例 2.5.1 相同 . 

解法 一 :Jordan 分 解法 . 

A 的 Jordan 分 解 为 4 = PJP7', 其 中 P,J 见 式 (2.5.10). 因此 


从 而 
4) 一 生 一 44 十 643 一 642 十 64 一 3T 
= PJ’ PP" —4P]’ P+6P]? PP 一 6P 大 PP 十 6PJP- 一 3PIP- 
一 下 (太一 4 并 十 6 天 一 6 下 十 6 一 3D 疡 -: 
三 PA(J) P” (为 什么 不 直接 算出 各 个 A"? ) 


0 1 01I1L100f0 1 0 | 
二 10 2 lilI00 DOD 2 1 

一 上 一 用 有 下风 一 | 一 

名 简直 仁和 下 了 < 和 下 加 
一 |00 2 1 0 |- 区 2 0 

| lJ-21 0 1 Q@1 
一 4 一 了 


思考 :最 后 的 结果 算式 4 一 工 显然 很 简单 ,这 难道 仅仅 是 巧合 吗 ? 
Matlab 的 内 置 函 数 polyvalm(ca,A) 可 用 于 计算 矩阵 多 项 式 . 本 题 的 调用 格式 为 


ca= [1-46-66- 3]; B= polyvalm(ca,A) % 注意 ca 是 多 项 式 系数 , 降 震 排 列 
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例 2.6.4 求 5 阶 Jordan 块 = J;(2) 的 寡 帮 . 
解 :将 分解 为 J 二 21 十 N, 其 中 NN = 二 J;(0). 计算 可 知 


0 0 1 6 Tv 1 
号 0 0 0 1 
IE = 0 © 1|,.W= 0 9 0|， 
0 0 0 0 
0 0 
0 0 0 0 
DRD0 
和 一 0 0 Ol,N=O (二 5) 
0 0 
0 


因此 根据 牛顿 二 项 展开 式 ,可知 


7 4 
T= (N+2D" = 2)CN’ (2D™ = D2) C2TN: 
i=0 1 一 0 
22 C1 21 (Gz 和 92 人 D1-3 Ca 入 294 
27 [Oa Dil 人 站 2 一 2 a 加 2m3 


全 过 9n Cy s 91 (人 和 92 


2 Ci s or 
2 
如 果 二 3, 显然 "右上 角 的 元 素 Cs，2": 中 的 C 没有 意义 ,而 计算 可 知 此 时 该 元 


素 应 该 为 零 . 由 于 这 种 情况 具有 一 般 性 ,因此 我 们 规定 : 当 有 二 nn 时 , C* = 0. 
一 般 地 ,可 以 证 明 , 对 于 t 阶 Jordan 矩阵 J,(4)，, 成 立 


pa 四 CE i CAD 

让 已 法 ml i CAT 
JAD) = aA” i : (2..6. 6) 
[Wb 


a 
其 中 , 当 上 二 nn 时 ,规定 C= 0. 

当然 ,更 多 的 时 候 我 们 不 是 直接 计算 A”. 

例 2.6.5  ( 辈 波 那 契 数列 ) ”电影 ( 达 。 芬 奇 密码 》 中 出 现 的 那 串 神秘 的 数字 “13， 
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3,2,21,1,1,8,5”, 按 升序 重新 排列 后 ,就 是 斐 波 那 契 数列 ， 众 所 周知 , 一 于 (5 一 1) ~ 


0. 618 被 称 为 黄金 数 , 大 自然 中 处 处 有 “黄金 ”如今 斐 波 那 契 数列 已 被 广泛 应 用 于 现代 物 
理 、 准 晶体 结构 .化 学 等 领域 . 

我 们 来 求 斐 波 那 契 (Leonardo Fibonacci,1175 一 1250, 意 大 利 数学 家 ,最 早 研究 斐 波 
那 契 数列 ) 数 列 { 方 } 的 通 项 公式 ,其 中 


ho= f= Wf = fa faa (2. 6. 7 
令 忆 = 《 扣 ,fmr1)， 则 式 (2. 6.7) 被 改写 为 矩阵 向 量 形式 : 
8 1 0 
有 = ,Fo C2, 6. 8) 
1 1 
递 推 可 知 
F, = AF, = .AF,» 3 一 4"Fo C2, 6. 9) 


计算 可 知 4 的 特征 值 为 a1 一 方 (1+V5), a 一 去 (1 一 /5), 相应 的 特征 向 量 为 hh = 


(1,ai ST h; = Cl, ga), 并 且 有 Fo 二 hi = h;,， 代入 式 《2， 6. 9)， 并 注意 到 A"h., == 
a?h;(i 二 1,2), 即 得 
二 > n get 1 n n Es 1 n n 
和 (hi 一 请 ) 于 hi—A Wy = hy 
从 而 可 知 
fn» 后 ( 5 ) ( 7 ) (C2. 6, 10 


Matlab 提供 了 运算 符 ” “可 用 于 直接 计算 矩阵 的 高 次 宕 ,比如 本 题 的 调用 格式 就 是 
N= diag (ones (1,4) ,1);I= eye(5); J= 2* I+ B; Jn= yn 
当 n 是 整数 时 ,Matlab 是 通过 不 断 平方 来 计算 A" 的 ,比如 4 的 计算 方法 就 是 
A' =(A)*.A:.A 
2.6.3 Cayley-Hamilton 定理 及 最 小 多 项 式 


Jordan 标准 型 的 计算 复杂 ,而 特征 多 项 式 与 之 关系 密切 . 由 于 Cayley 和 Hamilton 
发 现 矩 阵 的 特征 多 项 式 是 矩阵 的 零 化 多 项 式 ( 相 当 于 零 因 子 式 ) ,因此 类 比 多 项 式 的 带 余 
除法 理论 ,以 适当 的 零 化 多 项 式 为 商 ,将 矩阵 多 项 式 转化 为 相应 的 余 式 , 从 而 降低 多 项 式 
的 次 数 , 就 成 了 另 一 种 思路 . 

定理 2.6.1 (Cayley-Hamilton 定理 ) ” 阶 方 阵 4 E R” 是 其 特征 多 项 式 p(A) = 
121 一 A| 的 “ 根 ”, 即 PC4) = O. 

分 析 : 从 形式 上 看 , 当 n 二 1 时 , g(4) = |41 一 A| 二 0, 即 此 时 A 为 p(X4) ==0 的 根 . 
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因此 我 们 将 4 形象 地 称 为 特征 方程 p(A) = 0 的 “ 根 ”, 虽 然 一 般 地 , p(4) 和 |4I 一 A|. 
证 明 : 设 方 阵 4 的 Jordan 分 解 为 4 = PJP™. 我 们 将 了 了 表示 为 


> 
A2 
ke 
四 
其 中 , Ai，… 是 A 的 特征 值 , k; 二 1 或 0, i 二 1,2,…,n 一 1. 则 A 的 特征 多 项 式 可 
表示 为 
p00) = | 1 一 4 一 (一 1 一 12) CoN,) 
从 而 
p(C4) 一 (4 一 1ND(CA 一 0220 (4 一 2T) 


= (PJPT —AD(PIPY —XAD* PJP — ,1) 

二 了 COJ 一 1 有 (JJ 一 2 有 (JJ 一 人 TD) PP 
计算 可 知 , (J 一 DD(J 一 2D…(J 一 4,1) 是 零 矩 阵 , 因 此 p(4) = POP- 一 O. 证 毕 . 
定义 2.6.1 设 f(4) 是 关于 4 的 多 项 式 . 如 果 f(4) = 0, 则 称 FA) 是 矩阵 4 的 零 

化 多 项 式 (annihilator polynomial). 
显然 矩阵 4 的 特征 多 项 式 p(X) 是 矩阵 4 最 常见 的 零 化 多 项 式 . 
例 2.6.6 用 Cayley-Hamilton 定理 重 解 例 2. 6. 3. 
解法 二 : 基于 特征 多 项 式 的 Cayley-Hamilton 法 . 
矩阵 4 的 特征 多 项 式 为 pgQ) = | 一 4| 二 居 一 入 十 54 一 2, 则 gp(4) = O. 由 于 
FA) 一 1 一 人 十 613 一 612 十 6 一 3 
由 多 项 式 除 法 可 知 Fu) = (3 十 Dp) 十 4 一 1, 因此 
一 2 1 0 


8C4) 一 (4 十 Dop(C4A) 十 4 一 TI 一 4 一 TI[ 王 | 一 4 2 0 
i 9 1 


对 于 多 项 式 f(4) 的 带 余 除 式 fQ) = gq(X)g(4) 十 rQ)，Matlab 提供 了 内 置 函 数 
deconv, 可 用 于 求 出 商 式 gq(4) 和 余 式 >(A), 调用 格式 为 


[q, r] = deconv (f, 9g) 


其 中 ,常数 都 表示 降 短 排 列 的 相应 多 项 式 的 系数 . 

显然 , 除 式 gG) 的 次 数 越 低 , 余 式 r() 的 次 数 自然 也 越 低 ,这 样 计算 量 就 会 大 大 
降低 . 

定义 2. 6.2 在 矩阵 A 的 所 有 零 化 多 项 式 中 ,次 数 最 低 的 首 一 ( 首 项 系数 为 1) 多 项 
式 称 为 4 的 最 小 多 项 式 (minimal polynomial) , 记 为 m2). 
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例如 ,在 例 2. 6. 3 中 ,和 矩阵 4 的 特征 多 项 式 为 pg(2) 二 (4 一 2) (4 一 1)? ,我们 自然 猜测 
它 的 最 小 多 项 式 是 否 为 m4) = (4 一 2) (2 一 1), 计算 可 知 m(4) = 二 (4 一 2D (4 一 也 关 0， 
见 这 仅仅 是 “ 想 得 美 ?而 已 . 问题 是 我 们 为 什么 会 有 这 种 想法 呢 ? 

换个 矩阵 试 试 . 可 到 哪儿 去 找 这 样 的 矩阵 呢 ? 从 东 找 到 西 , 从 南 找 到 北 , 历 经 千 山 万 
3 一 3 2 
一 1 5 一 2 
—] 3 0 
9p(4) 二 (4 一 2)?(4 一 4), 那么 它 的 最 小 多 项 式 是 否 为 m(4) = (4 一 2) (4 一 4) 呢 ? 验算 可 
知 确 有 (4 一 2D(4 一 4D 二 O01 这 不 禁 让 人 联想 到 沈从文 先生 的 轶 事 . 历尽 艰辛 , 沈 先生 
终 得 遂 所 愿 , 盼 来 了 佳音 :“ 乡 下 人 ,来 喝 杯 甜 酒吧 !1” 

当然 ,这 样 误 打 误 撞 显然 不 是 个 办 法 ,我们 需要 一 种 机 制 . 欲 知 详情 ,请 移 步 至 6. 4. 3 


2 


水 ,一 路 寻 寻 竟 竟 ,我 们 终于 更 得 一 个 矩阵 A = , 它 的 特征 多 项 式 为 


2.1 在 民 : 中 , 求 向 量 x 在 基 wliyas,asyai 下 的 坐标 ,其 中 : 
(1 @i 一 GT 一 (1 一 1 一 DT 一 (一 1 一 DT 一 (1 一 1 一 1,1)7; 
t= (1;2,1,1)7; 
(2) 0 = (1,1,0,D)T ,0 = (2,1,3,1)T7 0 一 〔〈1,1,0,0)7m 一 (0,1, 一 1 一 1)7; 
r= (0,0,0, DT 
2.2 已 知 展 : 中 的 两 组 基 : (TD :oa 一 (1, 一 1,0)7,os 一 (0,1, 一 1D)T,os 二 (0,0,1)T 和 
(ID:P = (1 ,一 1,1)7, 及 一 (0,1,1)7, 记 一 (1,0,1)7. 求 ; 
(1) 基 (TD 到 基 〈IIT) 的 过 渡 矩 阵 P; 
(2) 在 基 (1) 与 基 (ID 下 有 相同 坐标 向 量 的 所 有 向 量 . 
2.3 判断 以 下 集合 对 于 所 给 运算 是 否 构成 民 上 的 线性 空间 : 
(1) 全 体 上 三 角 ( 下 三 角 ) 和 矩阵 ,对 于 短 阵 的 加 法 和 数 乘 ; 
《2) 迹 为 0 的 全 体 和 给 阵 , 对 于 短 阵 的 加 法 和 数 乘 ; 
《3) 平 面 上 不 平行 于 某 一 向 量 的 全 部 向 量 的 集合 ,对 于 通常 向 量 的 加 法 和 数 乘 ， 
2.4 设 AE RR”w" 且 Qi1;02，…,Q, 为 A 的 列 向 量 组 ,证 明 R(A) 一 span(al ,as ，…,o，)， 
2.5 证 明 数 域 上 线性 空间 V 的 性 质 (A5)、(A6)、(A7)、(M3) 和 (M4). 
2.6 设 AE Rw” ,BE RR”. 证 明 :; R(4B) = R(A) 的 充 要 条 件 是 存在 CE 民 *, 使 
得 ABC = 4. 
2.7 使 用 范 德 蒙 德行 列 式 证 明 P[xj], 的 标准 基 1 ,zx,Xx?，,…,x”! 线性 无 关 . 
2.8 设 线性 空间 V 中 向 量 组 gl ,gs ，…,Q 与 向 量 组 PB ,PB,，…,, 满足 关系 式 : 


(pl ,Pp ，*** ,pb ) = (Gil YX2 »*" 0)P 


其 中 ,PP 是 m 阶 短 阵 .证 明 下 面 三 个 条 件 (a)(b)(c) 中 任意 两 个 成 立时 ,余下 的 也 成 立 : 
(a) Ql 02 ,0 线性 无 关 ;(b) PB ,Pp ,°° ,Pp, 线性 无 关 ;(c) P 可 送 . 
2.9 已 知 民 ” 中 的 两 组 基 : 
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10 


11 


12 


.13 
.14 


1s 


16 


17 
18 


19 


.20 


过 


G 1 下 “和 1 1 让 1 
ma mt at yt 
1 1 1 0 1 


1 1YT 1 = 二 业 
(ID :B, = 上 | ;= ， ) ,B; 一 [| | 
求 :(1) 基 (IT) 到 基 (IT) 的 过 渡 和 矩阵 P; 
1 多 
(2) 短 阵 4 一 (, ， 
(3) 在 基 (DD 与 基 (ID 下 有 相同 坐标 向 量 的 逢 阵 . 
已 知 P[tj] 中 的 两 组 基 为 : 
(TD: 记 (一 1, 户 (一 1 十 如) =1+t+i+r; 
(ID:igi0) 三 工 一 此 疡 (5 = 1-t,f(t) 一 二 一 此 
求 :(1) 基 (JI) 到 基 (II) 的 过 渡 和 矩阵 P; 
(2) 多 项 式 f(1) 一 3 十 2 十 刀 在 基 (IT) 下 的 坐标 向 量 . 
设 线性 空间 V 中 基 wi ,oz，…，,0n 到 基 有 ,应 ，… 及 的 过 渡 矩 阵 为 王 . 证 明 有 非 零 向 
量 @ EV 使 得 @ 在 两 组 基 下 的 坐标 向 量 相同 的 充 要 条 件 是 1 为 矩阵 了 的 特征 值 . 
证 明 数 域 民 上 所 有 n 阶 反对 称 答 阵 的 集合 SSR” 构成 线性 空间 ,其 维 数 为 


nn 一 1), 并 求 其 一 组 基 . 


证 明定 理 2. 3. 2. 

判断 下 列 集合 是 否 构 成 PLxj] 的 子 空间 ,其 中 f(x) € P[Lz] : 

(1) Vi 二 {p(x) | zz) 一 0); (2) Vs 二 {p(x) | p(x) 的 常数 项 为 0); 

(3) Vs = (p(x) | p(— x) = p(x))}. 

判断 下 列 集合 是 否 构成 RR” 的 子 空间 ,其 中 A GE R™. 
(DVi={A|deth=0}); (2)V:={4|A:=A}); (3)V3= {A|A:=0). 

设 U 为 所 有 与 矩阵 A € 民 ” 可 交换 的 矩阵 的 集合 , 即 避 一 (和 14X 二 XA,XE 
R™”}. 

(1) 证 明 U 构成 民 ” 的 子 空间 ，; 


) 在 基 (D 与 基 (ID 下 的 坐标 向 量 ; 


1 
(2) 当 n= 二 2 且 关 == [2 | 时 , 求 U 的 一 组 基 与 维 数 , 并 写 出 U 中 矩阵 的 一 般 
形式 . 
证 明定 理 2. 3. 5. 


已 知 @ 二 (1,2,1,0)T ,0 = C1,1,1,DT, B= (2,—1,0,D)T, B= (1,—1,3,7)7, 

Vi 一 span(ol ,0 ),， V2 一 span( 忆 , 慌 ). 求 Vi 门 V 和 Vi 十 Vi 的 基 与 维 数 . 

设 Vi,Vs 是 数 域 了 上 7 维 线性 空间 V 的 两 个 子 空间 . 

(1) 若 dimVi 十 dimVs 之 n, 则 Vi 与 V 必 含 有 公共 的 非 零 向 量 ; 

(2) 若 Vi CV 且 dimVi = 二 dimVj, 则 Vi 二 VV,; 

(3) 车 Vi 关 {0} 且 Vi 关 V (i 二 1,2), 则 VUVi 关 V，, 即 存在 gEV, 但 mV 
且 @ $V. 

已 知 PLtjs 的 子 空间 : 


*。 12 “。 
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2. 21 


2.26 


2.27 


2. 28 


U= {f0) | f= odtatitart iat ,2a 十 十 az 一 0,a 十 巡 十 2as 一 0)} 
求 :(1) U 的 一 组 基 和 维 数 ; 

(2) U 在 PLtjs 中 的 一 个 补 子 空间 . 
设 VI,V 分 别 是 数 域 民 上 的 线性 方程 组 如 十 心 十 … 十 二 0 与 如 二 二 … 二 汉 ， 
的 解 空 间 , 证 明 

R” = VOYV, 

下 面 所 定义 的 变换 中 是 否 为 线性 变换 ? 请 说 明理 由 . 
(1) 在 RR? 中 ,T(xisyx2yx3) 二 (x? ,Xo 十 TT3); 
(2) 在 RR? 中 ,T(xiyzxsyX3) 二 (2x1 一 XsTXo 十 273 ,TX1); 
(3) 在 Plzxj] 中, TT(f(x)) = f(x 一 1). 
省 明了 “TT 二 LVisVe); 这 里 TE€ELWVM wT' EL 
(线性 变换 的 构造 ) 设 wai ,@;，…',@, 是 线性 空间 V 上 的 一 组 基 . 对 于 V 中 任意 一 组 
向 量 记 ,Bp，,…, 忆 ， 必 存在 唯一 的 线性 交换 栈 , 使 得 Tl@;) = 二 BB (i=1,2,…,n). 
特别 地 , 丁 是 可 逆 的 当 且 仅 当 房 , 忆 ,…, 忆 也 是 V 的 基 . 
设 丁 是 n 维 线性 空间 V 上 的 线性 变换 , 且 对 某 个 向 量 wEV, 有 Tax) 了 关 0, 但 
T"(ax) 一 0. 证 明 向 量 组 w,T(a), ,Tri 是 人 的 一 组 基 , 并 求 厂 在 此 基 下 的 和 矩阵， 
已 知 RR? 中 的 线性 变换 工 在 基 (IT) : 


Ph = (—1,1.1)7,f = (1,0, —1)7,p 和 Cs 1) 


下 
下 的 矩 阵 为 中 一 | 1 1 0|. 

一 1 2 1 
求 :(1) 丁 在 RR 的 标准 基 (J):el 王 (1,0,0)T,es 一 (0,1;,0)T,ei 一 (0,0,1)T 下 的 


矩阵 A; 
(2) 向 量力 二 (1,1,1)7 及 古 (11) 在 基 (11) 下 的 坐标 向 量 ， 
已 知 线性 空间 U 二 {X 一 (zi )zxz | Xn 十 xzz 二 0} 上 的 线性 变换 
T(X) = B'X— XB 
1 
其 中 , B 一 (, 
已 知 RR* 到 R” 的 线性 映射 为 
Tr ss Ts Ly = (RW1 = wy 十 ys ws 
求 Ker( 丁 ) 和 Im(7) 的 一 组 基 和 维 数 . 
已 知 P[tj]; 中 的 两 组 基 为 : 
(D:fi(2) =1+22, fo) =it+2, f(t) =1+2+ 2; 
(ID:gi(t) = 1—t,g:(t) = 1+t ,g(t) = t+ 2. 
线性 变换 丁 满足 
Tl(g(D)) =2+RT(g2(t)) =1,T(g3(t)) 一 1 十 :十 万 


1 
下 求 UU 的 一 组 基 , 使 得 丁 在 该 基 下 的 矩阵 为 对 角 短 阵 . 
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2. 31 


2. 32 
2. 33 


2. 34 


2. 3S 


2. 37 


2. 38 


求 :(1) 丁 在 基 (1) 下 的 矩阵 A; 
(2) 对 于 Fi = 二 3 十 2t 十 刀 , 求 TC(f02)). 
已 知 P[tj]3 中 的 任意 多 项 式 f(1) 二 ao 十 az 十 az 在 下 的 像 为 


T(f(2)) ba (ao 一 Qi) 十 (ai 一 az) 十 (az 一 ao) 契 


(1) 求 Ker(T) 和 Im(T) 的 一 组 基 和 维 数 ; 
(2) 是 否 存 在 PLij; 的 一 组 基 , 使 得 工 在 该 基 下 的 矩阵 为 对 角 短 阵 ? 


1， 0 
已 知 2 维 线性 空间 六 中 ， 基 mi *as 到 基 羽 , 隐 的 过 渡 扰 阵 为 一 ( ,。)， 线性 


1 
变换 丁 满足 : 
了 (al 十 202) 一 所 十 Bp， T (2 十 cz) 3 Bh 一 应 


求 :(1) 征 在 Qi,@s 下 的 和 矩阵 4; 
(2)T( 房 ) 在 基 ai ,oz 下 的 坐标 向 量 . 
证 明 线 性 变换 工 的 不 变 子 空间 的 交 与 和 仍然 是 了 的 不 变 子 空间 . 
设 了 :和 7T: 是 线性 空间 从 上 的 两 个 可 交换 的 线性 变换 , 即 TiT:z: 一 T2Ti. 证 明 : 
(1) Ti 的 特征 值 子 空间 W 是 了 : 的 不 变 子 空间 ; 
(2) Ti 与 72 在 V 中 有 公共 特征 向 量 ; 
(3) N(T:) 和 R(T:) 都 是 十 ! 的 不 变 子 空间 . 


8- 全 工 
求 展 ”中 给 阵 4 一 |2 2 2| 所 对 应 的 线性 变换 十 的 所 有 非 平凡 不 变 子 空间 . 
1 0 8 
求 矩 阵 和 的 Jordan 标准 型 和 Jordan 变换 和 矩阵 P, 其 中 短 阵 4 分 别 为 : 
1 人 2 0 13 16 16 
hy | 0 2 0 (2) |—5 一 7 一 人 | 
一色 一 2 一 外 一 人 一 六 一 了 
4 一色 1 1 证 
(| 一 和 二 2 1 (4) | 一 83， 三 -如 3 
一 1 = = 坊 2 
= 0 0 
| 1 1 | Al 
| j: 起 = 0 一 1 | vera-| | % Jordan 
一 4 一 3 4， 
2 @ ==] 
标准 型 J 


X1(t) = 3z1 x2 CO— Zs, 
利用 甜 阵 的 标准 型 求解 线性 微分 方程 组 | 一 一 2zi 十 2xs， 

XI3(1) 一 一 2 一 2 3zs. 
= 和 4 
==] 史 时 和 
= 1 虚 


求 和 矩阵 A 二 的 所 有 Jordan 链 . 


和 矩阵 分 析 与 计算 


2. 41 


2. 42 


证 明 方 阵 A 的 转 置 矩阵 4 7 与 A 有 相同 的 标准 型 . 
色 一 1 一 之 
= 一 是 2 2 
0 0 1 
利用 Cayley-Hamilton 定理 证 明 : 任 意 可 逆 矩 阵 驴 的 逆 矩 阵 4 都 可 以 表示 为 和 岂 

的 多 项 式 . 
求 习 题 2. 38 和 习题 2. 40 中 的 矩阵 A 的 最 小 多 项 式 . 


已 知人 4 一 , 求 g5(4) 一 4 全 一 945 十 4 一 343 十 442 一 工 


第 3 覃 
内 积 空 间 


“抽象 不 能 单独 起 作用 . 在 几何 富有 成 果 的 科学 思维 中 ,直觉 和 抽象 是 交互 为 用 的 .” 
“用 几何 语言 代替 代数 语言 几乎 总 能 做 到 相当 的 简化 ,并 使 担 埋 在 一 大 堆 错 综 复 杂 计 算 
中 未 被 察觉 的 性 质 显 现 出 来 . ”事实 上 ,解析 几何 的 成 功 就 在 于 数 与 形 的 统一 ,即将 几何 
上 的 图 形 与 代数 上 的 数 结合 了 起 来 . 在 线性 空间 中 ,只 涉及 了 向 量 的 线性 运算 . 可 是 在 作 
为 线性 空间 具体 模型 的 向 量 空间 中 ,还 涉及 向 量 的 长 度 、 夹 角 等 度量 性 质 , 它 们 在 解决 几 
何 问题 时 起 着 关键 作用 ,因此 必须 把 度量 的 概念 引入 到 线性 空间 中 来 ,以 实现 代数 与 几 
何 的 完美 结合 . 


3.1 从 向 量 空间 R" 到 欧 氏 空间 R” 


3.1.1 从 向 量 的 内 积 说 起 


一 般 而 言 ,我 们 知道 ,现实 世界 是 3 维 向 量 空间 Ri. 在 高 等 数学 中 ,我 们 定义 了 点 积 
以 后 , 民 * 中 的 向 量 不 仅 有 了 长 度 ( 模 ), 还 有 了 两 向 量 之 间 的 夹 角 . 特别 是 有 了 垂直 概念 
后 ,我 们 可 建立 空间 直角 坐标 系 , 从 而 通过 解析 几何 方法 得 到 了 许多 优美 的 结果 . 自然 
地 ,我 们 希望 把 这 些 东 西 推广 到 一 般 的 n 维 向 量 空间 R", 使 得 几何 上 的 维 向 量 也 具有 
一 些 代数 度量 性 质 . 

将 3 维 空 间 中 的 点 积 推广 到 维 向 量 空间 R", 就 是 向 量 的 内 积 . | 

定义 3.1.1 对 于 RR” 中 的 两 个 n 维 向 量 x = (zi yr,T) yy 二 (yiyy2 yy)!， 
称 实数 


(x,y) | 十 ZX2 yz 十 :十 i 


为 x 与 y 的 内 积 (inner product) ,也 称 为 R” 的 标准 内 积 . 

注意 , (x,y) 有 时 也 表示 列 向 量 依 次 为 x 和 y 的 和 矩阵 ,因此 其 具体 含义 请 读者 参考 上 
下 文 来 理解 . 男 外 ,(x,y) 与 (x,y) 的 含义 也 不 同 ,后 者 一 般 表示 R? 中 的 点 ,或 者 维 数 为 
2 的 行 向 量 . 

为 了 区 别 于 向 量 空间 R”, 我 们 称 带 标准 内 积 的 向 量 空间 R" 为 欧 氏 空间 (Euclidean 
space) R”. 

由 内 积 的 定义 可 知 


。116 。 矩阵 分 析 与 计算 


Yi ZI 
Y2 Ze 
CB = rosy)| | 一 (mso 
Vn Tn 
写成 矩阵 记号 形式 , 即 
ks = x y= yx (yyx) (3.1,1) 
也 就 是 说 ,和 矩阵 乘法 中 的 “ 行 乘 列 法 则 ”, 其 实 就 是 左边 矩阵 的 行 向 量 与 右边 矩阵 的 


列 向 量 进行 内 积 运算 . 
定理 3.1.1 对 任意 x,y,z € R" 及 任意 & € R, 欧 氏 空间 R”" 中 的 标准 内 积 具有 下 
列 性 质 : 
(El1) 对 称 性 : (x,y) 二 (y,x); 
(E2) 双 线性 性 : 
(E2a) (x y,z) = (x,z)T (yz), (Rx,y) = kx,y); 
(E2b) (x,y+z) = (x,y) (x,z), (x,ky) = k(x,y); 
(E3) 正 性 ; 当 x 关 0 时 , (x,x) 二 0; 
(E4) 定 性 ; (x,z) 二 0 当 且 仅 当 x = 二 0. 
显然 , 双 线 性 性 使 得 内 积 所 表示 的 实数 具有 与 线性 变换 类 似 的 线性 性 ,因此 我 们 称 
性 质 (E2a) 为 左 线性 性 ,CE2b) 为 右 线性 性 . 根据 性 质 (E1) ,显然 可 以 从 左 线性 性 推出 右 
内 积 还 具有 一 个 非常 重要 的 性 质 , 即 Cauchy-Schwarz 不 等 式 . 
定理 3. 1.2 (Cauchy-Schwarz 不 等 式 ) 对 任意 x,y € R", 恒 有 


(x,y)* Cx,x)(y,y) (3 1 


用 坐标 形式 来 表示 , 即 为 
(HW 十 Toyz 十 下 十 Txyn) 才 (i 十 孚 十 十 XZ2)( 并 十 并 十 … 十 ) 
证 明 : 对 任意 %* € RR, 有 
0 委 (xz 十 My ,Xx 十 Ay) 一 (Cxxz) 十 24(Cxzy) 十 12(y，y) 
这 个 关于 4 的 首 项 系数 为 (y,y) 的 一 元 二 次 不 等 式 成 立 的 充 要 条 件 是 A 宇 0, 即 
4 (x,y)* —4(x,x)(y,y) 去 0 


当 y 关 0 时 , 取 4 二 一 3 代入 上 式 , 整 理 后 即 知 等 号 成 立 . 证 毕 . 


在 民 中 ,实数 a 的 长 度 即 为 绝对 值 |a| = Va…a; 在 R? 中 ,点 PC(a,6) 到 原点 的 距 
离 即 向 量 OB == (a,6) 的 长 度 为 |05|== Va 十 FY ;在 Ri 中 ,向 量 x== (ws,xs,zs)T 的 
长 度 为 


V 好 十 胡 十 好 一 V(x,x) 
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推广 到 民 "”， 则 n 维 向 量 x (zl »X2 ,TT E R” 的 长 度 或 范 数 (norm) 可 定义 为 


中 xl 三 V 寻 二 地 十 … 十 过 = V(x,x) (5. .3 
特别 地 , 称 |x| = 二 1 的 nn 维 向 量 x 为 n 维 单位 向 量 (unit vector). 显然 , 上 x 为 R"PR 的 


映射 . 
任意 久 维 非 零 向 量 x, 经 过 规范 化 或 单位 化 后 ,显然 可 得 到 相应 的 单位 向 量 . 
Matlab 提供 了 内 置 函 数 norm, 可 用 于 计算 向 量 x € R" 的 长 度 ,其 调用 格式 为 


norm( x) 


R” 中 的 长 度 或 范 数 具有 下 列 性 质 : 

定理 3. 1.3 对 任意 x,y € R” 及 任意 X% € R, 有 : 

(1) 正 定性 : xl 宇 0 且 |x|= 0 x= 0; 

(2) 正 齐 性 : |2x1== |4|: |x|; 

(3) 三 角 不 等 式 : |x 十 yl 过 | zl 二 1yl， 

证 明 : 从 几何 上 看 ,这 几 个 性 质 是 一 目 了 然 的 .我 们 只 给 出 三 角 不 等 式 的 证 明 . 

由 Cauchy-Schwarz 不 等 式 (3. 1. 2) 可 知 , (x,y) 过 xj. |y| ,因此 
|x+yl? = (xt yxty) = (x,x) yy) 2x,y) 

<lxl:+lyl?+2lxl: |y| = dxl+lyl)? 


此 即 上 x 十 y 下 过 1 上 xl 十 上 y|. 显然 , 当 x,y 同 向 时 ,等 号 成 立 . 证 毕 . 
对 于 任意 的 非 零 向 量 x,y € R",， 由 Cauchy-Schwarz 不 等 式 (3.1.2) 可 知 


| a 1 |< 1, 因此 ,类 似 于 高 等 数学 ,我 们 称 9 二 arccos FE 1 (0OE[L0,r] ) 为 7 
维 非 零 向 量 x 与 y 的 夹 角 (angle). 特别 地 , 当 (x,y) 王 0 时 , 称 x 与 y 正 交 (orthogonal) 或 
垂直 (perpendicular) , 记 为 x_ | y 显然 内 积 的 性 质 (E1) 保 证 了 两 向 量 的 夹 角 与 它们 的 顺 
序 无 关 . 
关于 长 度 ,平面 几何 中 最 著名 的 莫 过 于 勾 股 定理 . 与 之 类 似 , 范 数 具有 平行 四 边 形 
公式 : 
zt yl + ley = 2lxl: +2lyl: G.1 


这 里 ,|z 十 ?|, 1x 一 y| 分 别 是 以 x,y 为 邻 边 的 平行 四 边 形 的 两 条 对 角 线 的 长 . 
证 明 : 左 边 = 二 (x 十 y,x 十 y) 十 (x 一 y,x 一 y) 
三 (xz,X) 十 (yy) 十 2(x,y) 十 Crx) 十 (yy) 一 2(xzyy) 
一 2(x,x) 十 2(y,y) 二 2|xl? 十 上 y= 右边 
特别 地 , 当 x 十 y= 二 上 x 一 y| 即 (x,y) = 0 时 即 得 勾 股 定理 


Ix+yl? = |xl: + lyl? 
证 毕 . 
3.1.2 欧 氏 空间 R" 的 标准 正 交 基 
从 上 一 小 节 可 知 , 欧 氏 空间 R* 具有 许多 优美 的 性 质 ,可 谓 “ 恩 宠 之 极 ”. 让 我 们 再 接 
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厉 , 将 3 维 欧 氏 空间 民 ; 的 直角 坐标 系 推广 到 维 欧 氏 空间 RR”. 
我 们 知道 , 欧 氏 空间 Ri 的 标准 基 ei 二 (1,0,0)7 ,es 一 (0,1,0)7,e; 一 (0,0,1)T 两 两 
互相 垂直 ,并 且 都 是 单位 向 量 , 因 此 是 R’ 的 一 个 标准 正 交 基 . 而 且 有 


双色 Xl 
= | 二 1 到 ! | TX» EC2 片区 5 ps; = (el ye2 ye3) Xs 
3 3 


即 向 量 的 坐标 分 量 即 为 对 应 的 坐标 ! 难怪 上 天 如 此 偏爱 地 球 这 个 三 维 欧 氏 空 间 . 
换 一 组 新 基 wi ,wz ,as 又 如 何 ? 向 量 x 在 此 基 下 的 坐标 向 量 y 是 否 也 是 其 分 量 呢 ? 
由 式 (2. 1. 4) 可 知 ，,y 王 (aiyazy0s) (eliyezye)x 三 Pix 天 六 答案 是 Nol 
可 是 我 们 为 什么 会 有 如 此 想法 呢 ? 因为 我 们 希望 能 够 比较 方便 地 从 x 计算 出 坐标 y. 
从 内 积 的 观点 看 ,对 任意 x= (zi ,zz,z3) ER ,显然 , zx! 就 是 x 在 e1 上 的 投影 向 
量 的 代数 长 度 ( 即 带 正 负 号 的 长 度 ) ,从 而 有 


1 =xleosGx,0) = lxl] :人生 = (0) 


类 似 地 , zx; 二 (x,es) ,xs 二 (x,e3), 因此 向 量 x 可 分 解 为 
X 一 Zil el 十 Za ez 十 za eai 一 (Yel) el 十 (Xer)e 十 (xyei) 3 
一 般 地 ， nn 维 向 量 组 elye2y ye 是 R” 的 一 组 基 , 同 时 也 两 两 正 交 ,并 日 都 是 单位 向 量 . 
因为 显然 有 (ee) 二 645;t 二 1,2,…,n), 且 对 任意 x 二 (ziyzzo,…,z)'E€ RR", 也 有 
w= (Ke) (s 1,2,° ,mn) 
故 类 似 可 得 
X 一 (xz,el) el 十 (xyez)es 十 全 十 (xye)e， 由) 
即 向 量 x 也 分 解 成 了 它 在 标准 正 交 基 的 各 个 基 疝 量 e, 上 的 投影 向 量 (x,e,) e, 之 和 . 我 们 
称 式 (3. 1.5) 为 x 的 正 交 分 解 (orthogonal decomposition). 
定义 3.1.2 如 果 欧 氏 空 间 R" 的 一 组 基 两 两 正 交 ,就 称 之 为 R" 的 一 组 正 交 基 


(orthogonal base). 如 果 此 正 交 基 的 每 个 基 向 量 又 都 是 单位 向 量 , 则 称 之 为 R” 的 一 组 标 
准 正 交 基 (normal orthogonal base 或 orthonormal basis). 


显然 , e1 ,es，,…,e, 是 R" 的 一 组 标准 正 交 基 , 称 为 欧 氏 空间 R" 的 自然 基 Cnatural 
base). 

例 3.1.1 已 知 @ 三 (To 二 (1,0, 一 1)7, 求 @;, 使 Qi ,ts@; 为 Ri 的 一 
组 正 交 基 . 


解 :显然 wias 二 0, 即 | zs, 由 于 还 要 求 ofos 一 ojos 一 0, 故 令 A= (Qi os)T， 
xz 一 (zzzs)， 则 问题 变 成 解 方程 组 


P| | | 
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解 得 基础 解 系 8 二 (1, 一 2,1)". 取 o = 上 一 (1 ,一 2,1) ,验证 后 即 为 所 求 . 

从 标准 正 交 基 的 定义 看 ,有 三 个 要 件 : 

(1) 它 是 向 量 个 数 与 维 数 相等 的 线性 无 关 的 向 量 组 ; 

(2) 它 是 两 两 正 交 的 向 量 组 ( 称 为 正 交 向 量 组 ); 

(3) 它 的 每 个 基 向 量 都 为 单位 向 量 . 

三 要 件 互 相 之 间 是 否 有 重合 呢 ? 具 体 地 说 ,向 量 组 的 正 交 性 与 线性 无 关 性 有 什么 联 
系 呢 ? 注 意 到 两 向 量 线性 无 关 即 不 共 线 ,也 就 是 夹 角 不 为 0 或 x, 这 自然 也 包括 特殊 的 垂 
直 , 因 此 正 交 性 是 特殊 的 线性 无 关 性 . 一 般 地 ,我 们 有 下 面 的 定理 ， 

定理 3.1.4 若 欧 氏 空间 R” 中 的 向 量 组 wl ,0 ,…,@, 是 正 交 向 量 组 (两 两 正 交 ) ,并 
且 其 中 没有 零 向 量 , 则 @i ,az ,…,o, 必 线 性 无 关 . 

证 明 : 设 有 局 ,kR;，,…,k, 使 ki@i 十 kt 十 … 十 kg; = 二 0, 以 Ql (i=1,2,* ,1) 左 乘 上 
式 两 端 ,得 所 aiei 十 ki@s 十 … 十 kaieg, 一 0, 由 于 oroi 二 6;(i,j 二 1,2,…,7), 因此 
kaia; 二 0. 注意 到 @; 关 0, 即 @l@; = 二 ai|? 关 0, 故 得 k= 二 0(i= 二 1,2,…,7), 即 @， 
0 ,…,@; 线性 无 关 . 证 毕 . 

因为 定理 3. 1. 4 的 道 命题 不 成 立 , 所 以 我 们 自然 会 问 : 一 个 线性 无 关 组 ,在 “ 拉 齐 了 
队伍 ”, 成 为 一 组 基 之 后 ,如 何 “ 更 上 一 层 楼 ”, 成 为 一 组 标准 正 交 基 ? 

根据 定理 3. 1.4, 标 准 正 交 基 只 剩 下 两 个 要 件 : 

(1) 标 准 正 交 基 是 向 量 个 数 与 维 数 相 等 的 正 交 向 量 组 ; 

《2) 标 准 正 交 基 是 每 个 向 量 都 是 单位 向 量 的 向 量 组 . 

其 中 第 一 个 要 件 即 正 交 性 ,显然 很 不 容易 达到 . 那么 如 何 将 一 组 基 改 造成 为 正 交 
基 呢 ? 

设 @ ,Gs，… ,0 是 欧 氏 空间 R" 的 一 组 基 , ,Pp,…,p, 是 我 们 希望 得 到 的 正 交 基 . 显 
然 ,可 令 户 = ai. 问题 是 如 何 得 到 应 呢 ? 

联想 到 向 量 的 正 交 分 解 式 (3. 1. 5) , 将 w 正 交 分 解 为 w 二 邦 ! 十 ri ,如 图 3-1(a) 所 
示 , 并 考查 残 差 向 量 ri ,也 就 是 向 量 ws 在 房 上 做 正 交 投 影 后 的 残 差 向 量 六 . 由 于 = 
C2 一 好， 有 ni | ph ， 因此 


0 一 (六 :Pi ) = (az ,Pi) — kB ,PB1) 


解 得 一 《大 :入 7 故 可 令 记 二 记 一 名 一 各 :局 2p， 显然 此 时 (把 , 记 ) 一 0. 


(PB ,PB ) 


oi(B) 


(a) (b) 


3-1 利用 正 交 分 解构 造 标准 正 交 基 
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继续 考查 ws 在 房 , 户 所 张 平 面 上 作 正 交 投 影 后 的 残 差 癌 量 ,如 图 3 - 1Cb) 所 示 : 
12 三 CX3 — kp —k2p,， 7 2 了 h ?7 2 应 
由 (mm, 记 ) 一 (2 及 ) 二 0, 并 注意 到 ( ,pp) 二 0, 可 求 出 


(03 ,Bi) (cs ,pb;) 
Rk ， kk 
(BB) (Bp,p,) 


故 令 


(@s ,Pi) (@ ,Pp:) 
Fb 人 (PB ,BP (Bp ,BP 
显然 ,此 时 (Bb; ,PB ) = (Bs; ,PB;) 一 0. 
一 般 地 ,对 7 一 1 2,3，…71， 今 


PB =o,p= 0,— 过 Gb) i (1 


至 此 ,我 们 即 得 在 矩阵 计算 中 具有 基础 性 作用 的 Gram-Schmidt 正 交 化 方法 . 

定理 3.1.5 设 ”ol ,w ,0 是 欧 氏 空间 R" 的 一 组 基 , 则 按 式 (3. 1. 6) 构造 出 的 
忆 ,PB ，…,, 就 是 RR" 的 正 交 基 . 

再 将 正 交 基 房 ,B;,…,p, 单位 化 ,就 得 到 了 R” 的 一 组 标准 正 交 基 si ,8s，… ,sg,， 即 


1 2 n 
£1 一 £2 二 “一 
~ pl’® Tpl’” pl 


回 到 开始 的 问题 . 若 向 量 x 在 gj ,gz,…,g, 下 的 坐标 向 量 为 y 二 (yi ,ys,…,y,)'， 即 


X= yi2l1+ 2282 二 *… + NnEn 


则 对 7 二 1,2,…,n, 都 有 


(gi9X)—= (gi 9181 TT yzBz 十 ynEn) 
= yik(8 8) 十 yz(8i82) 十 … 十 六 (es ) 
= Yi(e: ,£7) 二 饭 
即 向 量 的 坐标 分 量 仍 是 该 向 量 与 相应 基 向 量 的 内 积 
我 们 知道 ,以 向 量 空间 R* 的 基 为 列 向 量 的 矩阵 是 可 闻 的 . 那么 ,以 欧 氏 空间 R” 的 
标准 正 交 基 为 列 向 量 的 抢 阵 会 特殊 成 什么 样 的 可 逆 和 矩阵 呢 ? 
设 C1，02， On 为 欧 氏 空 3 则 ] R” 的 一 组 标准 正 交 基 , 令 A = = (Qi ,02 ,0 )， 注意 到 
QiQ; = (iy0)) = 6; (i,j) = 1,2,.,n) 
即 


《Ci 2 0 = (6; ) 


Oo 


也 就 是 A'A 三 工 原来 矩阵 4 是正 交 矩阵 ! 这 就 是 正 交 和 矩阵 名 称 的 由 来 . 
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3.2 QR: 分 解 _ 


De 


QR 分 解 在 矩阵 计算 中 占据 相当 重要 的 地 位 . 利用 QR 分 解 ,可 以 解决 各 种 应 用 中 
(如 工程 力学 、 流 体力 学 、 图 像 压缩 处 理 、 结 构 分 析 等 ) 出 现 的 最 小 二 乘 问题 ,特征 值 问题 
等 矩阵 计算 中 的 核心 问题 . 


3. 2.1 再 谈 Gram-Schmidt 方法 


考查 可 逆 和 矩阵 4 的 列 向 量 组 wi ,az ,……o 的 Gram-Schmidt 过 程 .由 3. 1. 2 小 节 可 知 


| 三 tl1Q1 
£2 一 je RN [2 (@z 一 kg1) S ts0; 十 三 ?20 
: 1 
2E3 一 I = Ip; i 《os 一 AQI — ks@2) 三 303 十 20 + tlsQ 
一 般 地 ,对 7 1 2 7 有 
SE 
eae kg. 
“= BT -THT hm ho a 
二 0; 二 坷 jG 二 十 二 1 CS 2 1 


其 中 ,二 1B; 关 0. 这 也 就 是 说 ,Gram-Schmidt 过 程 实际 上 就 是 逐步 扩张 正 交 向 量 
组 gl ,82，…,g;， 使 得 
Span(8l1 ,82，…,8i) = span(@i,@;,** ,0,)) (8..2. 2) 
并 且 成 立 
hl 
(gl ,8 ,61) 一 (oly 0 ,0 ) 


1 mt 


使 用 矩阵 语言 ,就 是 O 一 4T， 这 里 4 一 (CC 2 ss) » 0= (81 * 区 2 2 ) 是 正 交 和 矩 
阵 ,T 二 (6) 是 上 三 角 阵 . 由 于 上 三 角 和 矩阵 的 逆 矩 阵 仍然 是 上 三 角 和 矩阵 ,车 记 R= 二 T71, 则 
得 4 二 QR, 其 中 上 三 角 和 矩阵 R 的 对 角 元 xr; 一 上 BB 关 0, 而 


r= (Qh); =e 0 = (ge) (i,j=1,2,%,nEi>j) 
定义 3.2.1 对 nn 阶 方 阵 A4, 如 果 存 在 正 交 和 矩阵 C 和 上 三 角 和 矩阵 及 , 使 得 
A=QOR (有朋 
则 称 式 (3. 2. 3) 为 矩阵 4 的 (完全 )QR 分 解 (full QR decomposition ) 或 正 交 三 角 分 解 


(orthogonal triangular decomposition). 


显然 , 当 矩 阵 4 可 逆 时 ,线性 方程 组 hx 二 5 变 成 了 QRx = b, 也 就 是 三 角 方程 组 
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Rx 一 0'b. 这 里 巧妙 地 利用 CO” 二 0 , 避 开 了 一 般 矩 阵 的 求 着 问题 ， 
在 式 (3. 1. 6) 中 ,注意 到 
(0; ,Bi ) 一 要 Bb ) Bb 
(BsB FP 中 (BisB) VB,sB) 


(@; ,BE 一 THER 


_ 1 入 、 抽 
‘wp TB 


因此 ,可 得 经 典 的 Gram-Schmidt(CGS) 算 法 如 下 : ai A 
(D 令 记 二 @i ,计算 m= 二 上 P| 及 gl = PB/ru; 


(2 = 2 Bm We pb: £; 
和 

QO 计 算 rysras'" yr, 以 及 rees oa 一 一 p, 

@ 计 算 一 上 Be 以 及 gj; = BB/ri. 2 

以 ?一 4 的 情形 为 例 , 向 量 产生 过 程 为 人 


3- 2 CGS 算法 的 向 量 产生 过 程 


hb El Pp > >Pph—&; 一 及 ”Ee 


如 图 3 - 2 所 示 . 


B® =3 1 
例 3.2.1 利用 CGS 算 法 求 矩 阵 A 二 12 1 一 6| 的 完全 QR 分 解 . 
0 4 2 


解 : Wl 三 (0,2,0)7,pB = 0 = 0,2,0)T, ii [Bp | 2,81 Fb CoO, LO 
11 


nz = (@ ,81) 一 1,p 一 C2 ji281 = ( dDady 722 | 应 | D8 上 1 
22 
(—3,0,4)"; 


rs = (Qs,81) 一 一 6,723 一 (os 82) 一 1， Bb; 一 Qs T1381 1238E2 一 二 (B06YT, 


7'33 |B; | 2,83 让 5 (0 


所 以 A 的 完全 QR 分 解 为 : 
一 加 ;和 
9 2 
QO=(gig283) = 1 0 0|,R=04= 0 5 1 (3. 2. 4) 
4 3 六 和 
人 


Matlab 提供 了 内 置 函 数 qr 用 于 计算 4 的 完全 QR 分 解 , 其 调用 格式 为 
[Q,R] = qr (A) 
而 ATLAST 库 中 提供 的 则 是 gschmidt 函数 ,其 中 涉及 CGS 算法 的 实现 代码 为 


R= Zeros (nN);Q= A;R(1,1)= norm (A(:,1)); Q(:,1)= A(:;,1)/R(1;,1);» 
for j= 2:n 
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R(1:j- 1,j)= Q(:,1:j- 1) 5 A(:,j); % 合 并 计算 rj ,rz sy*… sri 
Q(:7j)= A = Ql 1:j= 1)* R(1:j= 1 和 0; % 计 算 记 
R(T mm (I)= (tj R (si) 

end 

由 上 述 分 析 可 知 , &1 ,gz ，,… ,gs 是 通过 不 断 和 迭代 逐步 扩张 后 得 到 的 , 仅 当 需要 计算 &; 
时 , 才 用 到 w， 因此 此 前 不 需要 改动 w 的 值 . 事实 上 ,CGS 算法 实质 上 是 一 种 投影 类 方 
法 , 它 将 恨 * 正 交 投影 到 空间 span (g1,82,…,8;1)- (关于 这 个 符号 的 含义 请 参考 3. 4 
节 ). 遗憾 的 是 ,CGS 迭代 算法 在 数值 上 是 不 稳定 的 . 

幸运 的 是 ,对 CGS 算法 进行 一 个 简单 修正 就 可 以 使 问题 得 到 改进 ,这 就 产生 了 MGS 
(Modified Gram-Schmidt) 算 法 . 

MGS 算法 的 想法 是 每 当 产 生 一 个 新 的 gs 后 ,就 重新 计算 所 有 的 后 续 向 量 wj ,ai ，…， 
cp， 消去 其 中 包含 的 gs 成 分 ( 即 与 s 平行 的 分 量 ) ,从 而 使 这 些 改变 后 的 后 续 向 量 都 与 
已 计算 出 的 &1 ,82,… ,sj; 正 交 . 它 实质 上 也 是 正 交 投影 类 方法 ,是 处 理 大 规模 矩阵 问题 的 
子 空间 投影 法 的 基础 . 

MGS 算法 的 计算 步骤 具体 如 下 : 

(1) 令 Bh 三 CI; 

(2) 对 7 一 1,2,3，……,7 : 

四 计算 六 三 | 有 | 以 及 有 一 房 /7 


将 -和 
加 计算 王 Pymir mi 以 及 PB = 二 @ 一 Dryae (=j 十 1;j 十 2,…,n). 
k=1 
仍 以 二 4 的 情形 为 例 ,向 量 产生 过 程 如 图 3 - 3 所 示 . 


A 一 PE) 
(1) 
CN 一 着 人 C £ 
(1) wD 
CQ3 一 他人 3 3 £3 


(2) (3) 
0 一 ”20 0 PQ 人 


图 3-3 MGS 算法 的 向 量 产生 过 程 


例 3.2.2 利用 MGS 算法 求 矩 阵 4 的 完全 QR 分 解 ,其 中 4 与 例 3. 2. 1 相同 . 


解 : ml la | 2,81 (0,1,0)7,， tip == (oz ,£1) == 1 ,ris (os ,51) 一 一 6; 
0 一 02 一 7i281 一 (一 3,0,4)T，w8 = os 一 msgl = (1,0,2)7; 
(1) Qs 1 
re = los |= 5,8; 一 一 5 (3,0,4)", rzs = (gf" ,82) = 1; 
, (2) 国 
os” 一 087 72382 一 1 (8,0,6)', rss = ls? | 二 2,5: 一 和 — 二 (4 O03. 
9 733 5 


所 以 A 的 完全 QR 分 解 也 是 式 (3. 2. 4). 


人 矩阵 分 析 与 计算 


在 ATLAST 库 中 ， gschmidt 函数 也 实现 了 MGS 算法 ,代码 如 下 : 
R= zeros (n);Q= A; 
forj= 1:n; 
R{(j,j)= norm(Q(:,j));0(:,j)= Q(:,j)/R(I,J); 
R(j,j+ 1:n)= Q(:1j)'* Q(:,j+ 1:n); % 合 并 计算 六 ,Finra on 
Q(T Lm) Q(t Tm) QD Blrjt La) 


end 
3.2.2 和 矩阵 的 QR 分 解 


由 式 CB 2 可 知 ,线性 无 关 组 C1，02 ， 0; 也 可 被 改造 成 正 交 组 E182.°"°,8j, 
而 且 


a ee t1j 
(g11825°°° ,8)) = (Qi ,02,0 ) 
bj 
用 和 矩阵 表示 即 为 0=AT, 这 里 A oY (Qi 22 0 ) ? OO 三 (gl1 sB? ss T 是 上 三 角 
阵 . 车 记 R==T"', 则 形式 上 仍 有 A 二 QR, 其 中 上 三 角 和 矩阵 R 的 对 角 元 rj; 二 4B, 上 关 0, 非 
对 角 元 
rj 一 (QA); 和 二 2Ei Ci 一 二 (oj ,8;) C2 = 1,2,.…,nm 有 有 iz 7) 


定义 3.2.2 如 果 m Xn 阶 的 矩阵 0 满足 800 二 工 或 6807 = 工 ,, 则 称 和 矩阵 @ 为 半 
正 交 和 矩 阵 (semi-orthogonal matrix). 

显然 , 半 正 交 的 方 阵 就 是 正 交 和 矩阵 . 满足 CIQ@ = 五 的 半 正 交 和 矩阵 Q, 其 各 列 是 两 两 正 
交 的 单位 列 向 量 , 而 满足 00" = 瑟 的 半 正 交 撼 阵 @, 其 各 行 是 两 两 正 交 的 单位 行 向 量 ， 
即 CQ 的 各 列 是 两 两 正 交 的 单位 列 向 量 . 具体 使 用 时 ,可 依 上 下 文 来 确定 这 两 种 半 正 交 
矩阵 . 

定义 3.2.3 对 mXn(m 宇 nn) 阶 矩 阵 4, 如 果 存 在 m Xn 阶 的 半 正 交 和 矩 阵 Q (这 里 
0Q'0 = 二 1) 和 上 三 角 和 矩 阵 R, 使 得 


A= QR (3. 2. 5) 


则 称 式 (3. 2. 5) 为 矩阵 和 的 约 化 QR 分 解 (reduced QR decomposition ,如 图 3-4 所 示 ) 
显然 , 当 A 特殊 化 为 方 阵 时 , 式 (3. 2. 5) 就 是 式 (3. 2. 3). 


mxn mxn nxn 


图 3-4 和 矩阵 A 的 约 化 QR 分 解 (mm 宇 ) 
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定理 3. 2.1 ( 列 满 秩 阵 的 约 化 QR 分 解 ) 设 冯 义 慰 阶 矩阵 4 是 列 满 秩 阵 , 则 必 存 在 
m Xn 阶 半 正 交 和 矩阵 Q (这 里 CO 二 了) 和 非 奇 异 上 三 角 方 阵 R, 使 得 矩阵 A 具有 约 化 
QR 分 解 4 三 QR. 

推论 (可 逆 阵 的 完全 QR 分 解 ) 设 4 为 ” 阶 可 道 矩 阵 , 则 存在 二 阶 正 交 矩阵 Q 和 非 奇 
异 上 三 角 方 阵 R, 使 得 矩阵 4 二 QR. 


四 也 1 
> | 
例 3.2.3 ”利用 MGS 算 法 求 符 阵 4 一 |。 。 ,的 QR 分 解 
名 1 
解 : 设 4= (@i,@2;03), 令 7 二 ai|==5, 则 
81 二 各 (0. 8,0.4,0.4;0.2)T, ra = (@2,81) = 2,ri 一 (assl) = 1; 


nil 
a = 一 二 《0.4, 一 0.8, 一 0. 出国 6)T; 
0 = oa 一 ma8l 一 (0.2,0.6, 一 1.4,0.8)T; 


(1) 


rm = ol = (0.2, 一 0.4, 一 0.4;0.8)7; 


723 一 (3 ,BE2 ) 一 1， CS CS 1712382 一 (0,1, —1,0)T; 


: ci” 1 
rss = |as? | = V2 ,ss = = 一 9, 一 1007. 
33 


\ 克 
综 上 可 知 4 的 约 化 QR 分 解 为 
0.8 0.32 0 
5 多 了 
(0 OE 大 帮 
0 二 一 (gl ?区 2 BE3 ) wr ,及 一 COIA = |Q 2 1 
0.4 一 0.4 —V2/2 
6 0 克 
O22 8 0 
re 
eh Se 1 2 3 
例 3. 2. 4 求 列 空间 RCA) 的 标准 正 交 基 , 其 中 4= | 。] |. 
于 了 看 


解法 一 :CGS 算法 . 


设 罗 二 (ol ,os ,03 )， 今 


= 上 (1,1,1,1T; 
11 


rz = (@2,81) = 3,p, = @; raal 一 去 (一 1,1,1, 一 DD"， 


; : > 应 1 et 
r22 1 8 1,g; rz2 2 ( Ne 1> ; 


ris = (@3s81) = 6,723 一 (@3 s83,) =—== 2 


B= — rigi— rss = (一 2, 1 一 1,277， 
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1 = AA et 2,1, —1.2). 


El £2 .83 即 为 R(A) 的 标准 正 交 基 . 
解法 二 :MGS 算法 . 


设 4 一 (ol:c 令 rn = 二 上 al=2, 则 


81 一 4 一 汪 1 e111)T, ra = (@,81) = 3,r1 = (i,81) = 6; 
1] 
0 一 02 门 2BE1 = 去 I WE ED 
Qs C3 71381 一 ( i350 2 
(1) 
rz = |o®|=1,8 一 到 -一 二 ( 一 1,1,1, 一 Dr， 
722 2 
rzs 一 (03 382) —— 2, 0 和 2 = 0 Crags = (0,—1,—3,4); 


my = (2) = a 1 伺 
rs = |as? = y10 ,ss 这 Tt 2 


结果 与 解法 一 相同 . 
在 Matlab 中 ,提供 了 内 置 函 数 orth 可 用 于 求 mxXn 阶 和 矩阵 A 的 列 空间 R(A) 的 一 组 


标准 正 交 基 ,其 调用 格式 为 


Q= orth(A) 


其 中 ,返回 的 矩阵 Q 是 mr Xr 阶 半 正 交 矩 阵 , 且 == 7(4). 
对 列 满 秩 的 长 方 阵 , 其 实 也 存在 形式 上 的 完全 QR 分 解 ( 见 图 3- 5). 


mxm 


mxnm 


图 3-5 矩阵 A4 的 完全 QR 分解 (mm 三) 


定理 3.2.2 设 mXn(m 宇 n) 阶 和 矩阵 A 是 列 满 秩 阵 , 则 必 存 在 m 阶 正 交 和 矩阵 QO 和 
2 阶 非 奇异 上 三 角 和 矩阵 R, 使 得 矩阵 4 具有 完全 QR 分 解 


(3. 2. 6) 


| 
A=0 


证 明 :由 定理 3. 2. 1 可 知 ,存在 mXn 阶 半 正 交 和 矩阵 Q1 = (qi,q;,…,q,) 入 阶 非 奇 
异 上 三 角 和 矩阵 尺 , 使 得 4 = Q1R. 根据 基 的 扩张 定理 ,显然 正 交 向 量 组 qi ,q;,…,g, 可 扩 
充 为 R” 的 标准 正 交 基 gi ,gq2,… ,gg giz ,qn. 令 Q 二 (qi,gs,…,g,), 0; 一 
《Cg ,0GhH2 gm)， 则 有 
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R R 
A—QR- R10.0= (0,0)| -al | 
O O 


证 毕 . 


显然 ,在 式 (3. 2. 6) 中 只 选取 Q 的 前 n 列 ,组 成 半 正 交 和 矩阵 Qi, 即 得 同一 个 矩阵 A 的 


约 化 QR 分 解 A 二 QR, 因此 约 化 QR 分 解 也 被 称 为 矩阵 4 的 经 济 型 QR 分 解 . 当然 “ 便 
宜 没 好 货 ”, 此 时 的 @, 不 是 方 阵 ,不 能 直接 求 逆 . 因此 实际 使 用 时 选择 何 种 分 解 , 需 视 具 


体 情形 而 定 ， 另 外 ,有 的 书 中 也 宽泛 地 称 矩阵 (0 ) 为 上 三 角 短 阵 


例如 , 例 3. 2. 3 中 的 矩阵 A 就 具有 如 下 的 完全 QR 分 解 : 


4 2 1 0.8 0.2 0 —4V2/10 5 2 1 
2 0 1 0.4 一 0.4 V2/2 3V2/10 @ 记 了 
四 2 0 一 1 0.4 一 0.4 一 V2/2 3V27/10 0 0 
1 2 1 0.2 0.8 0 4V5/10 0 0 0 


事实 上 ,如 果 给 列 满 秩 矩阵 4 补 上 单元 列 ,就 可 将 结果 扩充 为 方 阵 的 QR 分 解 , 即 


4 2 1 0 8 Q2 0 一 4V27/10 8 多 0.2 

副 站 下 8 0.4 一 04 V2/2 3/2/10 全 和 0.8 
(4,el) = 

2 一 人 04 一 0.4 一 V2/2 32/10 0 0 2 0 

12 1 1 lo2 08 0 4/5/10 0 0 0 —4/2/10 


对 行 满 秩 的 长 方 阵 ,按照 类 似 的 “扩充 *“ 补 零 ? 措 施 , 是 否 存在 类 似 的 QR 分 


解 呢 ? 


命题 3. 2.1 设 mXn(m 牵 nn) 阶 和 矩阵 4 是 行 满 秩 阵 , 则 必 存 在 六 阶 正 交 和 矩阵 O 和 
m 阶 非 奇 异 上 三 角 和 矩阵 R, 使 得 矩阵 A 具有 完全 QR 分 解 


A= Q(R,0O) 


(3, 2, 7 


亲爱 的 读者 ,请 你 来 判断 这 个 命题 的 真 伪 吧 . 进一步 地 ,如 果 这 是 个 错误 的 命题 , 那 


又 该 如 何 修 改 , 使 得 其 正确 呢 ? 


既然 列 满 秩 和 矩阵 可 以 通过 “扩充 ”“ 补 零 ? 得 到 QR 分 解 ,那么 ,对 任意 和 矩阵, 是否 也 


可 以 如 法 炮制 呢 ? 
定理 3. 2.3 


(QR 分 解 ) 设 4 是 m Xn 阶 和 矩阵 , 且 其 秩 为 r(4) 二 ~ 二 0, 则 必 存 在 


阶 正 交 答 阵 和 Xn 阶 行 满 秩 和 矩阵 RR, 使 得 算 阵 4 具有 完全 QR 分 解 4 一 @{ ) 和 约 化 


QR 分解 A 二 Q1R, 这 里 CO 是 Q 的 前 > 列 构成 的 半 正 交 和 矩阵 . 
证 明 : 由 式 (1.2.11) 可 知 , 4 存在 满 秩 分 解 , 即 存在 m Xr 阶 列 满 秩 和 矩阵 B 和 xr Xn 
阶 行 满 秩 和 矩阵 C, 使 得 A = BC. 而 对 和 矩阵 B, 根据 定理 3. 2. 3, 又 存在 mm 阶 正 交 和 矩阵 O 和 


R 
O 
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本 R 人 a Ri 加 RiC a R ee 

- 阶 可 入 矩阵 Ri，, 使 得 有 = O( 0 ) ,因此 4=o( ojc=of 0， )=@(0)' 其 中 R=RC 
为 r Xn 阶 行 满 秩 和 矩阵. 作 列 分 块 @ = (@ 0) , 这 里 O 是 m Xr 阶 半 正 交 和 矩阵, Q, 是 
m Xm 一 7) 阶 半 正 交 和 矩阵 , 则 


R R 
4-al| -0 一 onto on 
O O 


证 毕 . 
例 3.2.5 (GramrSchmidt 正 交 化 过 程 能 否 用 于 非 列 满 秩 阵 ) 将 MGS 算法 用 于 非 列 
1 汐 可 
满 秩 阵 ,得 到 的 矩阵 @ 未 必 是 列 正 交 和 抢 阵 ,比如 对 和 抢 阵 4 = |0 0 11, 得 到 的 分 解 式 为 
| 
gg 
ji , 意 - 刘 V2 sa A 
A=|00 1I=|0 010 0 0|=0QR 
1 沁 1 1 0 0 1 
和 
育 0 
卫 二 
HE 沟 
其 中 的 矩阵 @ 不 是 正 交 和 矩阵 . 但 观察 可 发 现 ,只 要 将 @ 修改 为 0= | 0 0 “1|, 即 可 
生 站 
万 历 “ 
得 到 非 列 满 秩 矩阵 4 的 QR 分 解 . 
在 Matlab 中 ,调用 格式 


[IQ,R] = qr (A) 
返回 的 是 m 阶 正 交 和 矩阵 和 mXn 阶 矩阵 R, 且 m 室 n 时 R 为 上 三 角 和 矩阵 , m 达 nn 时 
R 为 行 满 秩 矩阵 . 另 一 种 调用 格式 为 
[Q,R] = qr(A,0) 
当 识 之 n 时 返回 的 是 mXn 阶 列 正 交 和 矩阵 Q 和 nn 阶 上 三 角 和 矩阵 R (注意 这 个 结果 未 必 
是 和 矩阵 4 的 约 化 QR 分解), 当 mm 过 nn 时 则 与 前 一 种 调用 格式 的 结果 相同 . 


_3.3 _ 欧 氏 空间 及 其 标准 正 交 基 


向 量 空间 中 向 量 的 长 度 与 夹 角 是 用 内 积 定义 的 ,引入 这 些 度量 后 的 线性 空间 ,自然 
就 推广 为 内 积 空间 . 在 内 积 空 间 内 引入 标准 正 交 基 后 ,向 量 的 内 积 运算 就 转化 成 了 我 们 
熟悉 的 向 量 空间 的 内 积 运算 . 在 矩阵 计算 和 微分 方程 数值 解 等 学 科 中 ,许多 重要 的 算法 


第 3 章 ”内 积 空间 。129 。 


都 与 正 交 性 有 密切 联系 ,因此 正 交 的 重要 性 ,无论 怎么 强调 都 不 过 分 . 
3.3.1 欧 氏 空间 


注意 到 内 积 是 从 两 个 向 量 得 到 的 一 个 数 ,按照 公理 化 的 精神 和 要 求 ,我 们 自然 希望 

过 确定 这 种 运算 的 一 些 性 质 ,从 而 给 出 线性 空间 中 内 积 的 公理 化 定义 . 

欧 氏 空间 R”" 中 内 积 的 性 质 前 已 述 及 . 研究 发 现 ,我 们 只 需 选 择 其 中 的 部 分 性 质 作为 
公理 . 

定义 3.3.1 设 V 是 实数 域 R 上 的 线性 空间 . 如 果 对 V 中 任意 两 个 向 量 @,p E V， 
按照 某 种 对 应 规则 ,都 存在 唯一 的 实数 (ga,B) € RR 与 之 对 应 ,并 且 这 种 对 应 规则 还 满足 
以 下 四 个 条 件 : 

(1) 对 称 性 :对 任意 .Bp EV, 都 有 (a; = (Bp,@); 

《2) 齐 次 性 :对 任意 wx, BE YY 和 任意 € R, 都 有 Ga ,PB) = 4(@,P); 

(3) 可 加 性 :对 任意 a;B,Y EV, 都 有 (a 十 B,7Y) 一 (@,7Y) 十 (Bp,Y); 

(4) 正 定性 :对 任意 a EV, 都 有 (a,@) 三 0, 当日 仅 当 @ = 6 时 ,等 号 成 立 . 
则 称 (a; 忆 为 a 与 B 的 内 积 , 称 定义 了 内 积 的 线性 空间 V 为 实 内 积 空间 (real inner product 
space) ,也 称 欧 氏 空间 . 

几 点 注意 : 

(1) 齐 次 性 和 可 加 性 合 称 为 内 积 的 双 线 性 性 ; 

(2) 从 定义 可 知 ,内 积 实 际 上 是 一 We ns (.,"):VXVPDR. 这 
样 同一 个 线性 空间 显然 可 定义 多 种 内 积 

(3) 欧 氏 空 间 R”" 仅仅 是 一 一 种 特殊 的 欧 氏 空 3 间 ]; 

(4) 由 于 向 量 的 内 积 与 向 量 的 线性 运算 无 关 , 所 以 欧 氏 空间 V 实际 上 是 特殊 的 线性 
空间 V, 即 定义 了 内 积 的 线性 空间 . 

例 3.3.1 考虑 无 穷 实数 数列 的 集合 五 二 {a | @ 二 (a1,as,…)'). 对 任意 


= (ai ,az i (bi Das) 和 卫 


规定 
X 十 硒 一 (ai 十 0 a02 十 ,Ra 全 (CRai ,Rd ee) 工 


验证 可 知 , 亚 对 上 述 运算 构成 线性 空间 . 
类 比 欧 氏 空间 R" 可 知 , 下 中 的 内 积 (ga,p) 应 “形式 上 ”定义 为 


(ax, 有 ) = PPro = B= ab tabs = Sb, C3, 3. 1) 


显然 ,必须 保证 此 级 数 收敛 . 特别 地 ,级 数 (a,@) = > 也 要 收敛 , 记 为 > < 一 十 oo. 


CI rb ee 3. 3. 1， 此 时 的 欧 氏 空间 被 称 为 希 尔 伯 特 空间 , 记 为 
, 即 亚 * 是 所 有 平方 和 收敛 的 实数 列 的 集合 ,也 就 是 说 


型: 王 {a | = (ai ,az < 雪 十 oo》 
i=1 
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另外 ,注意 到 欧 氏 空间 RR" 的 标准 内 积 与 二 次 型 类 似 ,因此 也 可 有 如 下 推广 : 
例 3.3.2 在 向 量 空间 R" 中 ,对 任意 x、y E R” 和 实 对 称 和 矩阵 A € SR”, 定义 实 
双 线 性 型 (Bilinear Form ) 为 

[x,y|] = (Ax,y) = y'Ax 《3. 3. 2 
容易 验证 Lx,y] 是 RR” 的 一 个 内 积 ,一 般 称 之 为 4 内 积 ,也 记 为 (x,y)a. 
特别 地 , x 二 了 时 Lx,xj 三 x Ax 就 是 二 次 型 ; 当 4 = 工时 就 是 R" 的 标准 内 积 
由 于 函数 也 可 以 看 成 向 量 , 所 以 内 积 也 可 以 推广 到 函数 . 先 考虑 折线 函数 : 

一 {f | f= (Fafa yd 

对 任意 f,g E 下 , 显然 其 内 积 可 “形式 地 ”定义 为 


(fs8) = figrt fag t "fren = Sfig 


如 果 将 一 般 函 数 看 成 具有 无 穷 段 折线 段 的 向 量 , 此 时 上 面 的 内 积 定义 又 会 变 成 什么 
形式 呢 ? 这 里 涉及 函数 的 无 限 求 和 …… 对 ,无 限 求 和 即 积分 ! 


例 3.3.3 对 任意 fg E Cla,b], 容易 验证 映射 


pb 
Cs =| /cosgCodz (3. 3. 3) 


是 CLa,o 的 一 个 内 积 , 称 为 函数 空间 CLa,4b] 的 标准 内 积 
证 明 : 仅 给 出 正定 性 中 定性 的 证 明 . 当 (7,/) 二 | 三 0 时 ,车 有 f(c) 天 0， 


<cE (a,0b), 则 由 函数 的 连续 性 ,存在 邻 域 NCc,6)，, 使 得 其 内 任意 点 x 的 函数 值 都 满足 
产 (z) 盖 0, 从 而 


che 。 
PPD=| Fd] Podz>n 


与 (f, 了 ) 一 0 矛盾 . 证 毕 

多 项 式 是 特殊 的 连续 函数 ,因此 对 任意 多 项 式 Ag € PLz],, 式 (3.3.3) 也 是 P[x], 
的 一 个 内 积 , 称 为 多 项 式 空 间 PLxj], 的 标准 内 积 . 类 似 地 ,对 任意 多 项 式 As E P[z] , 式 
(3. 3. 3) 也 是 多 项 式 空间 PLzj] 的 标准 内 积 

例 3.3.4 已 知 多 项 式 空间 P[17]， ee 一 个 内 积 


1 
fs8) =| psd fg € PL 
试 计算 下 列 函 数 的 内 积 ; f02) 二 1 一 十, g(1) 二 1 一 4t 一 522. 
解 : (f,2) 一 | G tit) m4t— 5)dt 


| (1 二 可 一 4 si)dt =2| (1—5r)dt =0. 
类 似 地 ,将 矩阵 看 成 由 行 向 量 依次 连接 而 成 的 一 个 超级 向 量 , 即 可 得 R” 的 内 积 
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例 3.3.5 在 矩阵 空间 R”” 中 ,对 任意 A,B € 民 ””,， 定义 


(A,B) = 3 Dasbs = = tr(BTA) = tr(A'B) ‘3 


验算 可 知 , 它 是 RR” 的 一 个 内 积 , 称 为 矩阵 空间 R” 的 标准 内 积 

注意 式 (3. 3. 4) 中 涉及 矩阵 迹 的 两 个 性 质 : 

(1) 对 任意 A € RR”, 有 tr(4') 一 tr(CA); 

(2) 对 任意 A E R”” 及 B E R**, 有 tr(4B) == tr(BA). 

在 欧 氏 空间 V 中 ,Cauchy-Schwarz 不 等 式 也 是 成 立 的 . 其 证 明 与 定理 3. 1. 2 完全 

相同 . 

定理 3.3.1 (Cauchy-Schwarz 不 等 式 ) 对 欧 氏 空间 V 中 的 任意 向 量 @,p, 恒 有 

(@,P)* < (a,0) (Bp,P) 《3 本 


当 且 仅 当 wx, 线性 相关 时 ,等 号 成 立 . 
由 于 线性 空间 及 内 积 运算 的 抽象 性 ws 不 等 式 也 有 着 广泛 的 
应 用 . 比如 在 函数 空间 CLa,o] 中 , 它 就 摇身一变 ,成 了 积分 形式 的 不 等 式 : 


bh b 
-=| f*Cx) dx -| (yz (3. 3.6) 


施 瓦 菊 (Hermann Amandus Schwarz, 见 图 3-6) 因 喜爱 
化 学 而 进入 柏林 工业 大 学 ,可 是 不 久 受 波 尔 克 (Karl Pohlke， 
1810 一 1876 ,工程 图 学 中 波 尔 克 定 理 的 提出 者 ) 影 响 , 迷 上 几 
何 , 进 而 修 读 了 魏 尔 斯 特 拉 斯 (Karl Theodor Wilhelm Weier- 
strass,1815 一 1897) 的 “积分 学 ”( 当 年 的 笔记 如 今 还 在 ) ,并 在 
魏 尔 斯 特 拉 斯 的 指导 下 获得 数学 博士 学 位 . 他 的 博士 论文 审 
稿 人 库 默 尔 (Ernst Eduard Kummer,1810 一 1893) 后 来 成 为 
他 的 岳父 . 

在 庆祝 魏 尔 斯 特 拉 斯 70 大 寿 的 纪念 文集 中 ,他 回答 了 

给 定 的 极 小 曲面 是 否 具有 最 小 面积 ”, 其 中 就 包含 了 不 等 式 

图 3-6 施 瓦 茨 (1843 一 1921) 《3. 3. 6) 但 对 几何 的 深厚 感情 所 带 来 的 伟大 的 直觉 洞察 力 ， 

使 得 他 能 够 从 更 高 层面 看 待 这 个 不 等 式 , 从 而 使 用 了 更 具 一 

般 性 的 方法 . 这 样 的 方法 适用 于 算术 几何 、 函 数论 等 许多 领域 . 换 句 话说 ,他 已 经 意识 到 
不 等 式 (3. 3. 5), 虽然 其 现代 意义 下 的 证 明 直 到 1918 年 才 由 外 尔 给 出 . 

前 面 欧 氏 空间 R" 中 的 范 数 .角度 等 概念 和 性 质 也 可 以 推广 到 欧 氏 空间 V. 

定义 3.3.2 对 欧 氏 空间 V 中 的 任意 向 量 @, 称 Co;a) 为 向 量 we 的 范 数 (norm)， 
记 为 |al. 特别 地 ,满足 ja| = ee 


对 于 欧 氏 空间 V 中 的 任意 @,p, 称 0 一 arccos ] J 为 a 与 Pp 的 夹 角 (angle). 特 
别 地 , 当 (gg,pB) = 二 0 即 9= 二 90 时, 称 @ 与 p es ,; 记 为 a | 有 


"pb 
| | (r(x Yd 
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易 证 欧 氏 空间 V 中 的 范 数 |ex| 也 满足 正定 性 、 正 齐 性 和 三 角 不 等 式 ,以 及 平行 四 边 
形 公式 和 勾 股 定理 . 

在 引入 欧 氏 空间 V 的 标准 正 交 基 之 前 ,显然 我 们 得 先 弄 明白 该 如 何 判 定 中 向 量 组 
0 在 上 一 章 , 对 部 分 线性 空间 ,我 们 探索 过 这 个 问题 ,但 现在 的 问题 是 有 了 

积 的 束缚 . 看 来 先 得 用 相关 工具 把 内 积 表示 出 来 ,这 个 工具 就 是 坐标 ! 对 ,通过 给 
人 氏 空 间 V 中 内 积 的 坐标 表示 形式 ,可 以 解决 判定 问题 . 

设 wo ,oz ,ou 为 欧 氏 空间 V 的 任意 一 组 基 , 向 量 w,8 在 此 基 下 的 坐标 分 别 x 一 
(zi rar ) y= ys , 则 内 积 


(wx, 有 ) 一 (>) zo, 2) yo);) 一 2 TC0» 2 yp0) (内 积 的 双 线 性 性 ) 
i=1 ;7=1 
> = > > Tiyj; (Qi ,0 ) 


i=1 j=] 


按照 二 次 型 的 记号 ,上 式 可 写成 
(cx: 有 ) = y'Gx 《3. 3.77 


由 于 x,y 的 任意 性 ,显然 矩阵 G 就 代表 了 内 积 ,这 似乎 又 印证 了 ”万 物 皆 数 ” 
定义 3 3.3 欧 氏 空 xx 全 V 的 一 个 向 量 组 wi 2 ，” 0 的 Gram 矩阵 指 的 是 


(Ci ,01) (Qi ,02 ) Ee (Qi ,0,) 

(Qo01) (G2902) … (s,Q0;) 
GQ ,0 ,0,) 一 

(QQI) (00 ) … (CQ 0) 


特别 地 , V 的 一 组 基 wa ,oz ,……o, 的 Gram 和 矩阵 又 被 称 为 这 组 基 的 度量 和 矩阵 (metric 
matrix). 

可 以 证 明 Gram 矩阵 G 是 对 称 正定 矩阵 . 

定理 3.3,2 设 G 是 欧 氏 空 和 V 的 一 组 基 el »Q2 "On 的 度量 矩阵, 则 

(1) G 是 对 称 和 矩阵 , 即 6G” 一 

(2) G 是 可 北 和 矩 阵 ; 

(3) G 是 实 正定 矩阵. 

定理 3.3.3 欧 氏 空间 V 在 不 同 基 下 的 度量 矩阵 是 合同 的 . 即 若 G,G 分别 是 欧 
空间 V 的 两 组 基 wo »Q2 00 和 PB ,1 Pb, 的 度量 和 矩阵, 并且 

(用 ;记忆 ) 一 (oo 0 )P 

则 G = PTGP. 

现在 可 以 给 出 判定 向 量 组 线性 无 关 的 方法 了 . 

定理 3. 3.4 欧 氏 空间 V 中 的 向 量 组 wi ,w ,…,w, 线性 无 关 的 充 要 条 件 是 wi ， 
op0 的 Gram 和 矩阵 G = 二 GC@ ,0 ，… ,as) 非 奇 异 即 可 首 . 

证 明 : 先 证 必要 性 . 如 果 @i ,@s，,… ,a 线性 无 关 , 则 它们 也 是 W 二 span(@i ,os ，…,@Q,) 
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的 一 组 基 . 假设 G 奇 异 , 则 Gx 天 0 有 非 零 解 xE RR:, 从 而 wx 天 0, 其 中 w 一 2iol 十 Zoos 
十 … 十 xXQ,， 故 由 正定 性 可 知 (xc,w) 关 0. 但 同时 又 有 


(a,0) 一 1 一 3 S10 st ix, x!'Gx = x'0=0 
i=1 i=1 


i=1 j=1 
显然 这 里 出 现 了 了 矛盾 . 
再 证 充分 性 . 如 果 @i ,os ，,…,@; 线性 相关 ,不妨 令 w, = tiQi 十 大 0 十 … 友 0， 则 


| 
(@1,01) Be (Qi1,0,1) (Ci ，> 20i) 
i=1 


天 
(oz ,00) … (oz 1) C0, 2) tig) 
|G| i=1 


二 
(Qo0) … (G0) (00i) 
it 一 1 


wl 
(oo (0) Di ,0) 
i=1 


= 
(00) (oo ) (ooyoo) 
i 一 ] 


(内 积 的 双 线 性 性 ) 
5—1 
(a. ,01) We (Qa, ,0 1 ) > (as ,0; ) 
i 一 1 
(lo) … (oo 1) (olyai) 
sl (oz ,01) … (oo 1) (os ai) 
= > 一 0 


(Qo01) … (oo 1 ) (os 0;) 


这 显然 与 G 非 奇 异 矛 盾 , 所 以 CI 02 ,Os 线性 无 关 ， 
例 3.3.6 ”用 和 矩阵 方法 重 解 例 3. 3. 4. 
解 : 首 先 求 自 然 基 1,t,# 的 度量 矩阵 G. 


1 
8 一 (olyol) = (1,1) = 1 。]1d 一 2 
1 
gy 一 (ol 0 ) = (1,71) =| 1 。td 一 0 


2 罗 
2813 一 《0l ,03 ) 一 3 82 一 《oz ,02 ) 一 3 82 一 0, g33 一 三 
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2 
2 0 3 
由 于 度量 矩阵 G 是 对 称 答 阵 , 则 G 二 10 二 0 
名 2 
可 ”各 
fC) 和 8 (0 在 自然 基 下 的 坐标 分 别 是 x 二 (1, 一 1,1)',y 二 (1, 一 4, 一 5)'. 故 所 


求 内 积 为 
《Po = yO = 0 

注意 :这 里 的 多 项 式 Fi) 与 g(7) 是 互相 正 交 即 互 相 垂直 的 ,你 能 想象 吗 ?” 另外 ,与 
例 3. 3.4 相 比 ,本 题 采 用 的 矩阵 方法 ,计算 量 显 然 更 大 ,那么 引入 矩阵 方法 的 意义 又 何 
在 呢 ? 

例 3.3.7 判定 欧 氏 空间 CL0,1] 中 的 函数 组 1,6z,2ez 是 线性 无 关 的 . 

3 2(e—1) 

3 12 雹 
2(e 一 1) 12 2(e:—1) 
8 二 (fiyfi), 1 二 1,2,3. 由 于 detG 关 0, 因此 函数 组 1,6z,2e* 是 线性 无 关 的 . 


3.3.2 欧 氏 空间 的 标准 正 交 基 


在 R” 中 ,选取 自然 基 i,j,k, 则 度量 矩阵 
(i) (isj) (isk) 1 相交 


解 : 设 广 l,fz ys e ， 计算 可 知 G = 这 里 


G= OD) (1) Qk) =I0 1 0|=I 
(Rk,71) (Rk,]) (k,k) 0 0 1 


此 时 由 式 (3. 3.7) 可 知 ,对 任意 @,B E Ri;, 有 (gg,; 必 = yrIx 二 yix, 即 此 时 内 积 是 
标准 内 积 ,并 且 用 坐标 计算 内 积 的 公式 有 最 简单 的 形式 . 我 们 当然 希望 在 欧 氏 空间 中 通 
过 适当 选取 基 , 使 得 欧 氏 空间 的 度量 矩阵 也 是 单位 矩阵 ,或 者 尽 可 能 简单 些 . 
定义 3.3.4 ”如果 欧 氏 空间 V 的 一 组 基 两 两 正 交 ,就 称 之 为 V 的 一 组 正 交 基 . 如 果 
这 组 正 交 基 的 每 个 基 向 量 又 都 是 单位 向 量 , 则 称 之 为 V 的 一 组 标准 正 交 基 . 
由 傅立叶 级 数 的 知识 可 知 , 欧 氏 空间 CL[0,2xj] 的 一 组 标准 正 交 基 是 


1 1 
cosT ,二 Sin7… 一 coOSIT ,sinnr ,*"* 


质 反 亏 Vx Vx 


在 小 波 分 析 及 有 限 元 等 学 科 中 ,小 波 基 和 有 限 元 实际 上 也 是 相应 欧 氏 空间 的 正 交 基 

同 欧 氏 空间 R" 一 样 ,在 欧 氏 空间 V 中 ， 正 奖 全 赴 符 殊 的 厂 性 无 美 性 . 

定理 3. 3. 5 若 向 量 组 CI 02 ， 0: 是 欧 氏 空间 V 中 一 组 非 零 的 正 交 向 量 组 , 则 Qi1， 
2 ,Os 必 线 性 无 关 . 

证 明 : 设 有 ki1 ,Rk2 人 使 ki@i R202 十 … + ka, 一 0， 用 wi (7 一 1 2，…)5) 与 等 式 
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两 端 做 内 积 , 得 


(on km 十 …… 十 Raoi) 一 > 和 oo) 一 (0o) 一 0 
1 一 1 


由 于 (oo) 二 0 关门 以 及 (qj sy@;) 关 0, 因此 二 00 二 1,2,…,s). 证 毕 
因此 , 剩 下 的 情形 同 欧 氏 空间 R" 类 似 , 即 欧 氏 空 间 V 也 可 以 有 Gram-Schmidt 正 交 
化 过 程 . 
我 们 来 谈 谈 Gram-Schmidt 正 交 化 过 程 的 两 位 发 明 人 ， 
格拉 姆 (Jorgen Pedersen Gram, 见 图 3 - 7) 长 期 任职 
于 丹麦 的 Hafnia 保险 公司 ,因此 他 本 质 上 是 一 位 业余 数 
学 家 ,尽管 他 拥有 理学 博士 学 位 . 他 的 研究 领域 涉及 不 变 
量 理论 、 森 林 模 型 .概率 和 数值 分 析 、 数 论 等 . 他 经 常 在 丹 
麦 数 学 会 演讲 ,并 担任 数学 杂志 的 编 委 和 审 稿 人 . 遗憾 的 
是 ,由 于 语言 问题 ,他 的 森林 管理 和 开发 模型 虽然 比 德国 
数学 家 的 更 佳 , 却 没 能 获得 应 有 的 国际 地 位 . 让 人 壬 筑 不 
得 的 是 ,虽然 他 如 今 因 Gram-Schmidt 正 交 化 过 程 而 闻名 ， 
但 他 并 不 是 第 一 个 使 用 这 种 方法 的 人 . 事实 上 ,更 早 些 时 | 
候 , 拉 普 拉 斯 和 柯 西 都 使 用 过 这 种 方法 . 更 令 人 唤 咕 不 已 的 ”图 3-7 格拉 姆 (1850 一 1916，) 
是 ,他 死 于 突 发 的 车 视 撞 死 他 的 ,不 是 汽车 ,而 是 自行 车 ! 
与 格拉 姆 相 比 , 施 密 特 (Erhard Schmidt, 见 图 3 一 8) 则 
一 直人 生得 意 ,而 且 他 的 工作 显著 地 影响 了 20 世纪 数学 的 
发 展 方向 . 他 是 那些 被 希 尔 伯 特 的 显赫 声望 吸引 到 哥 廷 根 从 
事 积分 方程 研究 的 青年 才 俊 之 一 . 大 约 在 1905 年 ,基于 希 尔 
伯 特 对 带 对 称 核 的 积分 方程 的 研究 ,他 证 明了 此 时 积分 方程 
具有 实 特征 值 ( 按 希 尔 伯 特 的 术语 ) ,并 将 与 这 些 特征 值 相对 
应 的 解 称 为 正 交 函数 . 两 年 后 ,他 给 出 了 从 线性 无 关 函 数组 
构造 正 交 阴 数 组 的 方法 , 即 如 今 的 Gram-Schmidt 正 交 化 过 
程 . 1908 年 ,他 发 表 了 一 篇 重要 论文 ,涉及 有 无 限 个 未 知 数 、 
无 限 个 方程 的 方程 组 ,在 文中 他 引入 了 大 量 欧 氏 几何 中 的 记 
人 它们 如 今 仍 被 使 用 在 函数 空间 和 欧 氏 空间 中 . 他 
图 3- 8 施 密 特 (1876 一 1959) 将 空间 互 ( 即 如 今 所 谓 硕 尔 伯 特 空间 ) 定 义 为 平方 可 和 复数 
序列 的 集合 ,并 定义 了 内 积 、 范 数 等 概念 . 在 文中 他 还 再 次 给 
出 了 Gram-Schmidt 正 交 化 过 程 ,并 研究 了 投影 和 谱 分 解 . 这 些 工作 使 得 他 理所当然 地 被 
视 为 现代 抽象 泛 防 分 析 的 创始 人 之 一 . 
取 标 准 正 交 基 的 种 种 益处 ,现在 可 概括 为 下 面 的 定理 : 
定理 3.3.6 设 gs ,8 是 欧 氏 空间 V 的 一 组 标准 正 交 基 , 则 对 任意 向 量 
@ 一 Zi81 rg 二 Tz EV 


有 zz = (os) ,1 = 1,2,…,n, 也 就 是 说 ,向 量 的 坐标 分 量 是 该 向 量 与 相应 基 向 量 的 
内 积 
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定理 3.3.7 设 si ,sz ，…'8, 是 欧 氏 空间 Y 的 一 组 标准 正 交 基 , 则 对 V 中 的 任意 两 个 
向 量 


w 一 Xgl rg tx, P= be bg tt hen 


仍然 有 
(0a,Pp) = Qi0Dl 十 czp， 十 J 十 CO， 


从 上 面 的 定理 看 , 欧 氏 空间 V 中 向 量 的 内 积 具 有 了 R" 中 标准 内 积 的 简单 形式 , 即 向 
量 的 内 积 就 是 (标准 正 交 基 下 ) 坐 标 向 量 的 内 积 . 这 样 ,借助 于 基 和 坐标 ,各 种 欧 氏 空间 中 
“向 量 ” 的 内 积 运 算 ,都 可 转化 为 欧 氏 空间 R" 中 的 内 积 运算 . 万 物 再 一 次 缘 数 , 毕 达 哥 拉 
斯 主义 又 胜 一 局 . 

再 来 看 欧 氏 空间 V 中 两 组 标准 正 交 基 间 的 过 渡 和 矩阵 . 虽然 在 线性 空间 中 ,一 组 基 不 
一 定 能 构成 矩阵 ,但 是 两 组 基 之 间 的 过 渡 和 矩阵 却 是 可 道 矩 阵 . 因此 对 于 带 内 积 的 线性 空 
间 , 即 如 今 的 欧 氏 空间 ,虽然 标准 正 交 基 同样 不 一 定 能 构成 矩阵 ,但 标准 正 交 基 间 的 过 渡 
矩阵 肯定 要 比 可 道 矩 阵 特殊 . 联想 到 欧 氏 中 以 标准 正 交 基 为 列 向 量 的 矩阵 是 非 
党 特殊 的 正 交 和 矩阵 ,而 欧 氏 空间 R" 是 特殊 的 欧 氏 空间 V, 我 们 自然 希望 欧 氏 空间 V 也 
有 如 此 好 运 . 

定理 3.3.8 设 ss，…8 和 1;P，,… ,Wy 是 欧 氏 空间 V 的 两 组 标准 正 交 基 , 则 两 
组 基 间 的 过 湾 和 矩阵 是 正 交 矩阵 . 

证 明 : 设 两 组 标准 正 交 基 间 的 过 渡 和 矩阵 为 已 , 即 有 


pu pal Pmi 

Pi: p22 pm2 
《17 » 12 ) EE (gi »B2 yo gi 

pin pan 3 Dm 


显然 矩阵 P 的 各 列 就 是 NP 在 标准 正 交 基 El BE2 "°° ,8 下 的 坐标 , 故 由 定理 SY 可 知 
(97) = papn 十 … papi 
由 于 钱 ,区 ,… ,mm 也 是 标准 正 交 基 ,所 以 (yw) 二 训 ， 从 而 papi 十 … 十 pipin 二 
6;， 也 就 是 P'P = 并 即 和 矩阵 了 是正 交 矩阵. 证 毕 
由 定理 3. 3. 8 可 以 想到 ,标准 正 交 基 si ,82,…,g, 通过 正 交 算 阵 P 二 (pi, ps，*…,p,) 
过 渡 而 来 的 向 量 组 ,ww,… ,wy 一定 也 是 标准 正 交 基 . 因为 


(7 ,7 ) 一 (pagi 十 Dogs c+ page, Piigi 十 pizgz 二 "十 pingn) 
= 2 Papn (gi ,E84) 一 2 papa = PIp;= 6 


en 3.,9 gi 间 V 中 ,向 量 组 1» 2, 在 标准 正 交 基 si ,gz ，……s, 下 
例 3.3.8 i {X= (xij) | za 一 zz 一 0} 是 带 标准 内 积 的 矩阵 空间 民 2 的 
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1 2 
子 空间 , 求 V 的 一 组 标准 正 交 基 , 使 得 V 中 的 线性 变换 本 (X) 一 X{ 。 “ ) 在 该 基 下 的 矩 


多 也 
阵 为 对 角 和 矩阵 ， 

解 :首先 ,注意 到 RR 的 自然 基 Ei ,Ei ,Ez ,Ez, 不 符合 要 求 (理由 是 什么 ?). 
其 次 ,由 于 

il ZX 1 地 1 0 0 

X= 一 Tl 十 C12 十 X21 

X21 Tol 1 
、 1 _# 1 _/00 
记 X, 一 (0 0) X= (0 0) = 1 )- 显然 


(XI ,XX,) 一 tr(XT XX,) 一 0 
Sp = trCXT X;) 一 
(X, ， 闫 ;) tC 六 ;) 二 0 


因此 Xi ,X;,X 是 一 组 正 交 基 ,这 样 所 求 似 乎 就 是 它 标准 化 后 的 结果 , 即 


x 1 交 
YY 二 一 一 人 一 
V (XI ,Xi ) |, 0 
a 和 他 ' 浊 
VG ls | 
pa _ 1 0 0 
Vv (X; , 关 ,) /2 1 1 


遗憾 的 是 , Yi ,Y; ,Ys 在 线性 变换 二 下 的 矩阵 不 是 对 角 阵 ! 

不 过 ,前 面 的 工作 并 没有 白 做 . 我 们 可 以 从 Yi ,Yz,Y; 出 发 ,通过 正 交 和 矩阵 ,将 之 过 渡 
到 欲求 的 标准 正 交 基 . 联想 到 实 对 称 和 矩阵 可 以 正 交 对 角 化 ,因此 可 以 结合 线性 变换 , 寻找 
出 相应 的 实 对 称 和 矩阵 . 由 于 


业 “ 风 让 有 多 多 
0 WJI2 1 0 0 
G EE] "(lL 多 儿 | 
0 Ql2 1 0 0 
a ] 0 | | | 0 
7Y3) = 二 一 二 一 = 3Y 
“ Yh ills 1| Vils s 
此 即 
业 多 0 


7 (YYys) 一 (mV ,73)|2 1 0|= 0,Y,,Y)A 


0 0 3 
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显然 ,这 里 的 矩阵 A 是 实 对 称 和 矩阵 ! 


0 V2/2 一 V27/2 
将 实 对 称 和 矩阵 正 交 对 角 化 ,可 得 正 交 和 矩阵 8 = |0 V2/2 V3/2 | , 它 使 得 
i 0 


Or4O = 07AQ = A = diag(3,3,— 1) 
故 由 定理 3,.3, 9, 令 (ZN ,2 ,Zs ) = (号 YY ,Ys )O， 其 中 0 = (qi » 2 ;3)， 则 得 所 求 的 
标准 正 交 基 为 


1 
Zi = (Yi,Y2,Y3) q1 = (Yi,Y2,Y3) 10|=Y, -站 | 
1 
太古 = mo 
.| 2 2 V210 0 


ZL: = (Yi,Y;,,Y;) as 


Fo 


i 让 | 一 1 
和 
2 2 | 


例 3.3.9 ”在 多 项 式 空间 RR [加 ,中 ,定义 权 函 数 为 -一 上 的 带 权 内 积 为 


i 
FR 
cfg = | 有 /Wed frg€ RL 


试 求 R [tjs 的 一 组 正 交 基 . 
解 : 显 然 应 该 从 RR Ltjs 的 自然 基 1,t,,# 出 发 ,对 之 应 用 正 交 化 过 程 即 可 . 
邻 拨 二 1,fz = 二 tf3 = 二 蕊 ,fi = 二 台 , 则 所 求 为 


| 
js 
Nl 
~ 
Fo 
. 
~ 
. 
f= 
OO. 
二 


(万 ,81) 
[一 > cd 
(g1,g1)8! 


8 三 万 一 1,8: 王 广 1 1 


| 
上 

| 
Sa 


(fs,81) (fa,82) 


B83 fa Cg1 sg1) 1 (ga we) 六 
| l 。1*»。 ldt | of tdi 
-LV1 一 龙 -1 V1 一 区 ， 
t T ] 1 I = 一 2 
。]1 。 1 尼 | 。L。 tdt 
-1 Vi T= 并 
ga ga (fu,g1) 加 (fa,g2) (fa,83), 
(girg1)™” (gz,82) (gar83) 
| 1 7。 ld 1 »。13 。 dt 
pt I ,1 /IB 总 
1 1 
| 1 v1 1 | 1 -se tdt 
-1 Vli—£ Vl 
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1 3 。 攻 
| t »。(t 7) dt 


V1l—r 并 
i 
一 1 1 一 嫁 2 2 

= 3t 


将 所 有 和 多项式 的 系数 整数 化 , 即 得 著名 的 切 比 雪夫 多 项 式 ( 见 图 3 -9): 
Th lo Tt = #2, TA 二 =1sTs 0)= 一 用 


一 般 地 , Tn(t) = 27T, (7) 一 Ti1(t) (2 之 1)， 

切 比 雪夫 多 项 式 T,(t) 是 切 比 雪夫 微分 方程 
(1 一 卢 )x 一 坟 ' 十 wx 二 0 的 解 .在 信息 科学 技术 中 ,基于 
切 比 雪夫 多 项 式 原理 设计 的 切 比 雪夫 滤波 器 是 在 通 带 上 
频率 响应 幅度 等 波纹 波动 的 滤波 器 ,与 理想 滤波 器 的 频率 
响应 曲线 之 间 的 误差 最 小 ,是 信号 处 理 与 滤波 器 设计 的 基 
础 性 理论 . 


3.3.3 正 交 投影 定理 


以 正 交 的 视角 来 考察 子 空间 及 其 直 和 ,就 得 到 了 正 交 
子 空 间 及 正 交 分 解 . 

定义 3.3.5 设 多 ,V: 是 欧 氏 空间 V 的 两 个 子 空间 . 对 Y 中 的 某 个 向 量 w, 如 果 对 任意 
BE Vi, 都 有 (a;B) 一 0, 则 称 & 与 子 空间 Vi 正 交 , 记 为 a | Vi .如果 对 任意 YE€ Vi, 都 有 
Y 上 Vs, 则 称 子 空间 Vi 与 V; 正 交 , 记 为 V， | Vi, 并 称 它们 的 和 为 正 交 和 , 记 为 Vi © V;. 

可 以 证 明 , 对 两 个 互相 正 交 的 子 空间 Vi 与 V 而 言 ,它们 的 正 交 和 WO W 一定 也 是 
直 和 Vi 名 Vz, 即 Vi 败 Vs 二 {0). 但 请 注意 两 个 子 空间 的 直 和 不 一 定 是 正 交 和 . 

既然 正 交 和 是 一 种 特殊 的 直 和 ,那么 它 当 然 具 有 线性 空间 中 关于 直 和 的 相关 结论 . 

另外 , Y 中 所 有 与 子 空间 Vi 正 交 的 向 量 的 集合 {a EV | @ | Vi} 也 构成 V 的 子 空 
间 , 称 为 Vi 的 正 交 补 Corthogonal complement) , 记 为 Vi. 

子 空间 的 正 交 补 是 否 存 在 呢 ? 下 面 的 定理 给 出 了 回答 . 

定理 3.3.10 设 V 是 欧 氏 空间 V 的 子 空间 , 则 存在 Vi 的 唯一 正 交 补 Vi ,使 得 V 
可 以 正 交 分 解 为 


图 3-9 切 比 雪 夫 多 项 式 


V=VIOVI 


注意 : 正 交 分 解 是 特殊 的 直 和 分 解 . 
证 明 : 存 在 性 . 设 sa ,gs，… ,gn 是 Vi 的 一 组 标准 正 交 基 ,对 任意 w EV, 令 


Cl 一 〈Q,81)8 十 (xs )8 十 … 十 (oggs0s 一 ww 一 ol 


则 w E, 且 


(oz 8) 一 (Co:8) 一 (ol:8) 一 (os) 一 (> (asse) 
1 


j= 
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一 (03 有) 一 (0yB)(02 ED 一 0， 站 yD ys ,pn 


故 ws 与 Vi 中 的 每 个 向 量 都 正 交 , 即 we € Vi, 注意 到 @ 一 @ 十 @2 以 及 V1 | VL ,因此 
V =VO@vVt. 
唯一 性 . 设 wz ,Vs 都 是 Vi 的 正 交 补 , 则 对 任意 02 E Vs, 由 存在 性 ,有 


Q@ = To 0 EVi,m EV 
Ql 一 (CC 81 )5i 让- (CC 82 )8? 十 … 十 (CE8n ) Em 


又 因为 ws | oos | a, 所 以 0= (@ 0) = (T6301) 一 (Colal) 十 (osyal) 一 
(oo 从 而 @ 二 0,@ 一 0 十 @; 二 QE 及 . 故 凤 近 W. 同 理 可 证 Vi 导 V. 因此 凤 = 
Vs. 证 毕 . 

定义 3.3.6 设 V 是 欧 氏 空间 V 的 子 空间 .对 任意 me EV, 若 有 @ EVi, gs € Vi， 
使 得 @ 二 w 十 , 则 称 w 是 在 Vi 上 的 正 交 投影 (orthogonal projection). 

同上 一 章 的 投影 变换 一 样 ,从 映射 的 角度 看 , 正 交 投影 仅仅 是 同 态 映 射 ,不 是 同 构 


映射 . 
定理 3.3.11 ( 正 交 投影 定理 ) 设 Vi 是 欧 氏 空间 V 的 子 空间 , 则 对 任意 a EV, 向 量 
0 在 Vi 上 存在 唯一 的 正 交 投影 . 

从 正 交 的 视角 看 , 齐 次 线性 方程 组 Ax = 0 显然 等 价 于 ( 记 ,x) = 0, (局,x) 二 0,…， 
(xz) 二 0, 这 里 记忆 ，…, 忆 ”为 矩阵 和 A 的 行 向 量 组 , 即 4 二 (pi , 访 ,…,B,). 因此 求 方 
程 组 hx 二 0 的 解 向 量 , 就 是 求 所 有 与 向 量 组 房 ,应 ，… 肥 正 交 的 向 量 . 换言之 , 求 齐 次 方程 
组 Ax 二 0 的 解 空 间 N(A), 就 是 求 span 人 (及 ,应 ，…… 育 } 一 RD) 的 正 交 补 空间 . 

一 般 地 ,对 于 矩阵 的 值 域 与 零 空间 ,存在 下 列 关系 . 

定理 3.3. 12 ”对 任意 4 一 (ooz，…o) E R” ,有 


R (4)L 上 一 NCAT),RC4A)ONGAT) = R”, R(A)L = N(A),R(GAT)O N(A) = R’. 
证 明 : R (MA)+ = {BIPB]| (kio hm 二 ko),k €E R)} 
= {PBIB ,i=1,2,…,n)} = {Bl|oalp = 0,7 = 1,2,.,n) 
= {pIlABS=0,7=1,2,.%,n) = N(AT) 
所 以 R”* = RA)OR(A)t= RC(A)O NG(AT™). 
同 理 可 证 RCI)O N(A) = 二 RR”. 证 毕 . 


3.4 最 小 二 乘法 


提起 最 小 二 乘法 ,一 般 将 之 归功 于 高 斯 ,他 于 1794 年 在 进行 大 地 测量 时 首创 了 此 
法 . 如 今 最 小 二 乘法 已 广泛 应 用 于 信和 号 处 理 、 自 动 控 制 . 物 理学 .统计 学 、 经 济 学 等 科学 与 
工程 领域 ,以 至 于 有 数学 史家 不 禁 感慨 :或许 19 世纪 最 重要 的 统计 方法 就 是 最 小 二 
乘法 . 
3.4.1 解 不 相 容 线性 方程 组 的 最 小 二 乘法 

对 于 不 相 容 的 线性 方程 组 Ax = b, 由 于 该 方程 组 无 精确 解 ,因此 我 们 只 好 设法 找 出 
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方程 组 在 某 种 规则 下 的 最 优 近似 解 . 最 小 二 乘 就 是 一 种 典型 的 规则 . 
记 A = (as)mxnob (CD ,De ,0,), * 一 《 动 9 车 有 x = 


(Xi ee ,Ts 使 得 
|Ax—bl’ <|Ar—bl: = D>) (am 十 ae 总 十 十 az —b)? (3.4. 1) 
1 一 1 


就 称 为 方程 组 Ax 一 六 的 最 小 二 乘 解 (least square solution) , 称 求 最 小 二 乘 解 的 方法 为 
最 小 二 乘法 (least square method), 称 问 量 + 二 b 一 Ax 为 最 小 二 乘 误差 向 量 , 并 称 其 范 数 
|4x 一 bi 为 最 小 二 乘 误差 (least square error). 

从 高 等 数学 的 眼光 看 , 令 


m 


flx) = |Ax—5b|’: = 2 (anzi Tanz 十 十 aa 一 Di)2 


f= 


则 多 元 函数 f(x) 的 最 小 值 满足 条 件 Es 


m 


0= 2)2aa aazit a tT ann — b:) 


i 


写成 矩阵 形式 , 则 为 
EL 区 12 十 一 0 
CI2 U22 ”Qi2 al 二 azz Xz 二 "1+ C2nTn bs 0 
dln 2n on Cym dml Xl | Um2 XT2 | ee | GQmTn Om 0 
也 就 是 法 方程 或 正规 方程 (normal equation) 


A'(Ar—b)=0 (3. 4. 2) 


例 3.4.1 试用 代数 多 项 式 曲线 拟 合 下 列 数 据 : 


Ti 1|3 4|5 6| 7 8|9110 
Yi 10| 5 4|2 1|1 2|3|4 


解 :如 图 3-10 所 示 , 这 组 数据 的 变化 趋势 接近 于 抛物 线 , 故 设 所 求 代数 多 项 式 为 
yz) = co tciz+ cx! 
将 这 组 数据 代入 线性 方程 组 Ac 二 b, 这 里 


A= {Cad doses i = ly10;; = 0,1,2 


C= (co 3?C1 9C2 YT 


b= (105 ds lal sD 
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二 JJ uo om ~ ®m ow 


图 3-10 多 项 式 拟 合 


即 得 法 方程 A'Ac 二 A'b, 其 中 
9 53 381 32 
4I4 一 |53 381 3017 |,4IZ 一 |143 
381 3017 25317 1025 
解 得 c = (4I4) (ATb) 一 (13. 4597, 一 3. 6053,0. 2676)T, 故 所 求 为 
yy 一 13.4597 一 3.6053 工 十 0. 2676z 
Matlab 中 提供 了 内 置 函 数 polyfit 用 以 实现 多 项 式 拟 合 , 具 体 请 查阅 Matlab 帮助 文 
档 . 本 题 的 实现 代码 为 
x= [1345678910]; y= [1054211234]; 


p= polyfit (x,y,2) ; % 参 数值 2 表示 多 项 式 的 次 数 ,多 项 式 的 系数 以 降 短 方 式 保存 在 向 量 p 中 
BlGOt (KY + B', ,Bolyval(Bx); .EE 分 


3.4.2 最 佳 逼 近 定 理 及 其 应 用 


如 图 3- 11 所 示 , |Ax 一 bl 表示 b 到 Ax 的 距离 , |4x 一 b| 则 表示 4b 到 Ax 的 距离 ， 
显然 人 fr ,hx € R(4), 因此 14x 一 bl? 之 14x 一 5b|? 即 为 在 RC(A) 中 找 出 向 量 AX, 使 得 
向 量 b5 到 Ax 的 距离 比 b5 到 子 空间 R(A) 中 其 他 向 量 的 距离 都 短 ,这 样 , 求 不 相 容 方程 组 
的 最 小 二 乘 解 的 问题 就 是 求 向 量 b 在 R(4) 上 的 最 佳 通 近 AX. 

定义 3.4.1 设 Vi 是 欧 氏 空间 V 的 
子 空间 . 对 给 定 的 a EV 及 任意 Y E Vi， 
如 果 存 在 Bp E Vi, 使 得 18 一 cl 过 
17 一 cl , 则 称 有 为 c 在 子 空间 Vi 上 的 最 
佳 逼 近 (best approximation). 

定理 3.4.1 (最 佳 逼 近 定 理 ) 设 Wi 
是 欧 氏 空间 V 的 子 空 间 . 则 对 给 定 的 &€ 图 3-11 最 佳 逼 近 
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V, 回 量 w E 太 是 wx 在 W 上 的 最 佳 逼 近 的 充 要 条 件 是 os =a—o GEVL, 即 wi 是 @ 在 
Vi 上 的 正 交 投影 . 

证 明 ; 必 要 性 . 设 w EVi 是 @a 在 Vi 上 的 最 佳 逼 近 , 但 02 一 QX 一 Cl 不 正 交 于 Vi, 则 
至 少 有 一 个 非 零 单位 向 量 BE Vi ( 即 上 == 1 且 B 关 9), 使 得 (@;,p) 关 0. 

令 Y 一 oil 十 录 , 其 中 上 一 (ap)， 则 7yE Vi， 并 且 

la—7Yl? = (a —ip,0 一 二) = |e):— 1: = |a—el’— 1? 

因为 17? 二 0,; 所 以 je 一 71 二 le 一 ol. 因此 @i 不 是 a 在 Vi 上 的 最 佳 副 近 . 出 现 
矛盾 . 

充分 性 . 设 w € Vi 且 @ 二 Qa 一 Qi | Vi, 则 对 任意 的 BPE ww, 显然 有 wm 一 PE 人 六. 
因此 根据 勾 股 定理 ,有 

lc 一 外 | 一 wo 十 (oa pl = laal’+le —pl’: = le—al’ 


从 而 wm 是 we 在 W 上 的 最 佳 逼 近 . 证 毕 . 

根据 最 佳 通 近 定 理 , 记 7 二 Ax 一 b, 则 这 样 的 最 小 二 乘 解 满足 y | R(4). 今 A= 
(oo , 则 YL @j, 也 就 是 @jy 二 0G 二 1,…,n), 此 即 alAxX 二 aib, 写成 矩阵 形 
式 , 就 是 法 方程 


AT4 雹 一 4TD 
例 3.4.2 证 明 R? 中 定点 M(Czo ,yoyzo) 到 已 知 平面 r:Az 十 By 十 Cz 十 D=0 的 
距离 等 于 


_ |Azro 十 By + Czo 
A +B + 


证 明 : 记 x 中 所 有 向 量 之 集 为 W, 显然 W 是 RR 的 子 空间 . 设 向 量 w = OV = (zo， 
yoyzo) 到 WwW 的 正 交 投 影 为 @I 9 根据 最 佳 副 近 定 理 , 存 在 向 量 QE 三 十 ， 使 得 


X 一 Cl 十 oo:,Ql | as， 
由 于 x 的 法 向 量 n 一 (A,B,C) |W, 即 mE W+ ,从 而 e 一 [为 Wt 的 标准 正 交 
基 , 因 此 ws 二 (ag,e)e ,所 以 @ 到 W 的 距离 为 


d= le:|= | (a,e)el= | (ag,e)| 
| | Axo 十 By + Czo | 

0 ( 9 人 = 

A 


例 3.4.3 (三角 拟 合 ) 对 欧 氏 空间 CL0,2xj 中 的 非 线 性 函数 f(x), 可 在 子 空间 


d 


W = span{l,coszx,sinr,*" ,cosnr ,sinnr} 


中 求 f(z) 的 最 佳 逼近 , 即 求 某 个 三 角 多 项 式 方 (z) € W, 使 得 对 任意 p(x) € W, 都 满足 


| fC 一 已 (zl 及 zx 一 PCz)l: = jg LFGz) 一 PCz)]?dz 
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下 面 通过 一 个 例子 来 加 以 详细 说 明 . 
若 某 地 某 日 的 温度 记录 如 下 (时 间 间 隔 为 3 小 时 ) 


| 二 着 工 和 四 汪 
8 4 8 2 8 4 8 
y 2 吕 入 名 G1 有 一 


则 用 周期 模型 


y 王 cl 十 czcos2rt 十 casin2rct 


这 些 数据 的 效果 如 图 3 - 12 所 示 . 


5 


R 和 ER 3 
0 0.2 0.4 0.6 08 1 


3-12 三 角 拟 合 
例 3.4.4 (泰勒 多 项 式 逼 近 不 敌 正 交 多 项 式 逼 近 ) 对 欧 氏 空间 C[ 一 r,r] 中 的 函 
数 f(z) 三 sinz, 试 在 子 空间 U 二 R [xj 中 找 一 个 多 项 式 us (z), 使 得 
[foD 一 上 (用 一 CD 一直 Co 一 由 人 D) 一 | [fz) —us Ct) dr 
尽 可 能 小 . 
首先 想到 的 自然 是 泰勒 多 项 式 逼 近 i (zx) 一 工 一 条 


为 一 种 思路 是 从 自然 基 1,zx,zx? ,Tz ,x' ,x 出发, 通 正 交 化 得 到 标准 正 交 基 B1 ,52， 
53 ,54 ,85 ,56， 然 后 可 得 到 正 交 多 项 式 通 近 


Us(x) 一 (sl)sl 十 … 十 (ss)si 一 0.9878627z 一 0.155271z3 十 0.00564312z5 


Hay, 


谁 更 准确 呢 ? 取 xz 二 3, 可 算得 两 种 方法 的 绝对 误差 分 别 为 | f(3) 一 去 (3) | 一 
0. 3839 和 | f(x) 一 如 (x)| 二 0.0014. 相差 近 300 倍 ! 
例 3.4.5 (最 小 二 乘法 的 条 件 作 用 ) 用 7 次 多 项 式 拟 合 数据 (xz;,y;)，, 其 中 


Xi 三 2 十 0.2(i 一 1);% = 二 1 十 名 十 2 十 十 zx 一 1, 2 ,11) 
使 用 法 方程 法 ,算得 的 系数 为 
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€ = (3.4910, 一 5. 1515, 7. 4449, 一 2. 7139,2. 2715, 0. 7413,1. 0290,0 . 9986)7 
明显 与 理论 解 c= (1,1,1,1,1,1,1,1)' 相差 悬殊 . 

用 QR 分 解 可 轻松 化 解 上 述 尴 众 . 使 用 QR 分 解法 来 拟 合 ,得 到 的 最 小 二 乘 解 几 乎 
就 是 理论 解 , 且 最 小 二 乘 误差 为 1. 0467e 一 011. 

事实 上 ,对 不 相 容 线性 方程 组 Ax 二 b, 这 里 A 为 mXn(m 宇 n) 阶 和 矩阵 , 设 4 的 完全 


, 则 Ax 二 b 变形 为 Rx 二 QTb. 记 e 二 Rx 一 QT'b, 并 注意 到 


QR 分 解 为 A = QR -ol 


Ar 一 0 一 ORr 一 5 一 OCR — 0h)= Qe 
因此 


Ir 一 和 一 三 一 一 厅 
一 (Oe,Oe) = (Qe)' (Qe) 
= eT QQe = ee = (e,e) = lell? 


这 说 明 Ax = 二 b 的 最 小 二 乘 解 x 也 是 Rx = 二 0b 的 最 小 二 乘 解 . 令 
d=0%= did ds) d= divdas dd = (di ds dy) 
则 Rx 二 d, 且 el== |Rx 一 dl 十 lal. 因此 所 求 最 小 二 乘 解 x 满 足 方 程 Rx 二 d, 上 且 最 小 
二 乘 误差 为 
Irl= lel= |Rx—dl+ladl= 0+lad|= Va + a dtd 


3.5 Householder 变换 与 Givens 变换 


鉴于 正 交 的 重要 性 ,所 以 相应 的 正 交 变换 显得 尤为 重要 . Householder 变换 ( 即 反射 
变换 ) 和 Givens 变换 ( 即 旋转 变换 ) 是 两 种 最 重要 的 正 交 变 换 , 它 们 的 作用 主要 是 在 数值 
算法 中 构造 正 交 基 . 前 面 已 指出 ,二 维 平面 中 的 图 形 经 过 旋转 变换 或 反射 变换 后 只 是 位 
置 改变 了 ,形状 和 大 小 都 没有 改变 ,所 有 的 长 度 、 角 度 都 保持 不 变 . 而 向 量 的 长 度 和 角度 
都 可 以 由 内 积 来 计算 . 因此 ,变换 前 后 的 内 积 保持 不 变 , 即 两 向 量 的 像 的 内 积 与 原 像 的 内 
积 相等 . 由 于 二 维 平 面 是 特殊 的 欧 氏 空间 ,因此 这 个 想法 自然 也 可 以 推广 到 一 般 的 欧 氏 
空间 . 
3.5.1 正 交 变 换 及 其 矩阵 

定义 3.5.1 欧 氏 空间 V 上 的 线性 变换 十 如 果 保 持 V 中 的 内 积 不 变 , 即 对 任意 的 w， 
BEV, 都 有 

(To),T(P) 一 (Ca 有 ) (3. 5. 1) 


则 称 二 为 VY 上 的 一 个 正 交 变换 (orthogonal transformation). 
易 证 正 交 变换 也 保持 欧 氏 空间 V 中 向 量 的 长 度 、 距 离 及 向 量 间 的 夹 角 等 几何 属性 
不 变 . 
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定理 3. 5.1 设 本 是 欧 氏 空间 V 上 的 一 个 线性 变换 , 则 下 列 命题 是 等 价 的 : 

(1) 厂 是正 交 变换 ; 

(2) 丁 保持 向 量 的 范 数 不 变 , 即 对 任意 mEV, 都 有 上 TC(o)1 = lal; 

(3) 若 8&1,82，,… ,Es 是 Y 的 一 组 标准 正 交 基 , 则 7 (si),7T (ss),…,7(s) 也 是 V 的 标 
准 正 交 基 ; 

(DT 在 V 的 任意 一 组 标准 正 交 基 下 的 抢 阵 表示 为 正 交 矩阵 . 

证 明 : (1) 之 (2). 根据 正 交 变换 的 定义 显然 成 立 . 

(2) 之 (1). 若 线性 变换 保持 长 度 不 变 , 即 17o) 用 一 | 村, 六 (1 三 | 8, 因此 


(To),TCo)) 一 人 To) 有 上 一 el 一 (co) 
(TBTHB) = 三 CD 有 一 18 一 (8,D) 


类 似 地 ，(T (wx 十 及 ,7T(x 十 及 ) = (a+B,a 十 羽 , 展开 此 式 并 化 简 , 即 得 CT (ea)， 
TB) = (a,pP). 

(1) 二 (3). 显然 成 立 

(3) 二 (1). 对 任意 a,BEV, 令 gg= gi 十 十 245B= vig 十 … 十 yes， 则 


T 了 (ay) = Xr T ey 了 (es ) ee Tn Te,) 
T= Te)tiy% Ts) 二 Ty Te,) 


因此 (To) ,TBD) 一 my 十 十 zy = (0,P). 
(3)=>(4). 设 本 在 ElIy， 52， ,Bn 下 的 矩阵 为 A， 即 


(Tg),T(g2) ,Tg,) 一 (8218 BA 


由 于 (81) ,本 (82),…, 丁 (g,) 也 是 标准 正 交 基 , 所 以 A 是 两 组 标准 正 交 基 间 的 过 渡 
和 矩阵 ,由 此 可 知 4 是 正 交 矩阵. 
(4) 之 (3). 设 A = 二 (a;) 是 正 交 和 矩阵 , 则 
(7 (si) ,7 了 (gj;))= (auig1 十 aziE? = 填充 :本 CQ1iE1 十 avjE2 十 yb 


一 1 
CQ1iC1 1 TAQndn 一 0; 


所 以 了 (si) ,Ts ) ,Ts) 也 是 标准 正 交 基 . 证 毕 . 

根据 正 交 变换 与 正 交 和 矩阵 的 关系 , 易 知 正 交 变换 是 可 道 的 且 道 变换 仍然 是 正 交 变 
换 , 而 且 正 交 变 换 的 乘积 也 是 正 交 变换 ,因为 正 交 和 矩阵 的 逆 和 矩阵 及 正 交 矩阵 的 乘积 仍然 
是 正 交 和 矩阵 . 

例 3.5.1 (再 探 HouseHolder 变换 ) 如 图 3 - 13 所 示 , el,e 为 R? 的 一 组 标准 正 
交 基 ,显然 任意 向 量 x € R? 有 正 交 分 解 x 二 @ 十 pb, 这 里 @ 二 (x,ei) ei, P= (x,e;) @;， 
且 w 上 及 因此 向 量 x 关 于 “与 es 轴 正 交 的 直线 ”( 这 里 就 是 直线 e1 ) 对 称 的 镜像 向 量 y = 
XCx) € R? 的 表达 式 为 

y= xX—2p=x—2(x,e) es = XxX—2e(x,e,) 


= Xx—2e,elx= (I—2e, el)x= Hx 
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图 3- 13 2 维 Householder 变换 3-14 3 维 Householder 变换 


显然 ,这 里 给 出 了 式 (2. 4. 2) 中 的 HouseHolder 和 矩阵 互 的 另 一 种 表示 形式 . 

在 图 3- 14 中, 设 n 为 平面 x 的 单位 法 向 量 , 显 然 任 意向 量 xE R” 也 有 正 交 分 解 
x 二 Q 十 p, 这 里 二 (x,n)n 且 PB | x. 因此 向 量 x 关 于 “与 n 正 交 的 平面 "(这 里 就 是 二 维 
平面 x ) 对 称 的 镜像 向 量 y 二 (x) E R” 的 表达 式 为 


y=x—2p=x—2xmn = x—2nn,x) = x— 2nm'x = (I— 2nm')x = Hx 


类 似 地 ,将 向 量 x € RR" 变换 到 向 量 y = XCx) E R" 的 镜像 变换 妃 , 这 里 x,y 关于 
“与 单位 向 量 w € R” 正 交 的 n 一 1 维 子 空间 ( 称 为 n 一 1 维 超 平面 )” 对 称 ,应 该 对 应 和 矩阵 
H = I1—2wu.. 

定义 3.5.2 设 wE€ RR" 为 单位 向 量 , 称 矩阵 互 二 了 一 2uu7 为 Householder 矩阵 或 初 
等 反射 矩阵 ) ,对 应 的 变换 刀 称 为 Householder 变换 或 初等 反射 变换 或 镜像 变换 . 

Householder 变换 在 和 矩阵 计算 中 占有 重要 地 位 ,这 是 因为 通过 Householder 变换 可 
以 将 非 零 向 量 x 反 射 到 某 个 坐标 轴 上 (与 坐标 轴 同 向 或 反 向 ), 从 而 可 将 向 量 x 的 其 余 
一] 个 分 量变 为 零 . 这 在 几何 上 是 非常 明显 的 . 

定理 3.5.2 对 任意 0 关 x E€ R", 存在 Householder 矩阵 豆 , 使 得 Hx 一 士 | xle，,， 
其 中 ei € R" 为 标准 单位 向 量 . 

证 明 : 若 x 二 士 上 xlei, 则 取 与 e 正 交 的 单位 列 向 量 w, 从 而 


Hx = x—2(w,x)w = x =+ ||xllel 


若 x 关 士 |xlei, 令 w= py 其 中 v= 二 x 干 上 xlei ,注意 到 Dv|? = 2Gy,x), 则 


Hx = x— 2(v,x) FF 一 x 一 ?一 士 | zle， 


证 毕 . 
理论 上 ，| xl 前 的 两 种 符号 都 令 人 满意 . 但 为 了 数值 稳定 性 ,我 们 希望 向 量 x 在 大 小 
和 方向 上 都 不 要 太 接 近 |xlei. 设 x = 二 (和 ,后 0)T,， 几何 上 易 知 , 当 上 后 二 0 时 ， 
|x| 前 应 取 负 号 , 当 扣 过 0 时 则 应 取 正 号 , 即 
Hx =— sgn(éi)| xle, 


事实 上 ,车 取 Hx = sgn(é1) | xle, ’ 此 时 向 量 
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v=x— Hx=x sd )|xle， 
就 容易 接近 零 向 量 . 例如 , 当 上 后 之 0 时 , 若 有 xx 一 |‖xzle，, 则 
了 = Li V Ei 二 … Ea Ea) 2 0 


这 是 因为 v» 的 第 一 个 分 量 近似 为 零 , 这 导致 6&2” 十 … 十 6* 之 0, 即 ? 的 其 余 分 量 也 近 
似 为 零 . 所 以 为 了 避免 出 现 “ 几 乎 为 零 向 量 ” 的 ，， 应 令 


v= x sgn(éi)| xle 


这 样 至 少 可 保证 上 vl 三 | xl. 

定理 3. 5.3 Householder 矩阵 豆 具 有 下 列 性 质 : 
(1) 互 为 对 称 和 矩阵 , 即 有 H" = H; 

(2) 互 为 对 合 和 矩阵 或 寡 等 矩阵 , 即 有 H? = I; 

(3) 五 的 特征 值 为 1 (n 一 1 重 ) 和 一 1( 单 重 ); 


J I, O 
(UyHS= 网 | 仍 是 Householder 和 矩阵. 


证 明 :(1) 与 (2) 是 显然 的 . 

(3) 设 H=I 一 2u™, 则 tr(H) = trCD 一 2trCaT) 二 nn 一 2tr(uiu) 一 nn 一 2. 

设 有 He 二 X02, 则 a 二 Hie 二 入 @, 因此 4 = 土 1. 设 特征 值 1 与 一 1 的 重 数 分 别 为 
i\kz, 则 如 十 Rk 二 nn, i 一 kz 二 tr(H) 二 nn 一 2, 解 得 ki 二 n 一 1, ks 二 1. 

(4) 设 HH= 了 一 2wu7, 则 


To I ol ro 0 
= 一 一 
O 了 工 一 2rxxi O I, O 2rti 
0 站 
= 一 CO! Ut) = — 280 
u 


0 . | 
显然 ,一 ( Ee R 并 且 aTi 一 cr 人) = 六 三 证 举 

u u 
例 3.5.2 (Givens 变换 ) 式 (2. 4.1) 中 给 出 的 Givens 矩阵 G 是正 交 和 气 阵 ,因此 它 


对 应 的 是 一 个 正 交 变换 在 式 (2. 4. 1) 中 ,如 果 取 sin 一 一 全 一 ,cos9 二 一气 一 . 岗 
应 的 是 一 个 正 交 变换 . 在 式 中 ,如 果 取 si 地 J 


罗 二 0 (几何 上 表示 什么 意思 ?) ,此 时 (&1,&)TP(M@ 干 久 ,0). 
类 似 地 ,向 量 空 间 R? 中 的 任意 向 量 x 二 (&i,&,&)7 也 可 先 通过 Givens 变换 
cosO Sin0 0 


Ci (01) = — sinO cosO 0 
0 0 1 
变换 为 y= 二 (VY 妖 十 芒 ,05&) 。 这 里 sing 二 一 皇 __ ,oosg 一 一 鱼 _ 再 通过 
! 2 3 1 可 二 去 1 树干 名 
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Givens 变换 
cosO， 0 sing, 
G13 (0,) 3 0 RE 0 
—sing, 0 cosO; 
J nN bd & V8 十 
y 变换 为 z= 二 ( 各 十 名 十 乌 ,0,0) ， 这 里 sing es =- = on 一 一 
i ”VET i V 共 十 贸 十 有 
一 般 地 ,向 量 空间 R” 中 的 Givens 矩阵 为 
1 
1 
coOsO sing 第 i 行 
1 
(Ci (O) = 
1 
i cos0 第 7 行 
] 


在 Matlab 中 ,提供 了 内 置 函数 givens, 可 用 于 生成 Givens 矩阵. 

Givens 变换 在 矩阵 计算 中 也 很 重要 ,这 是 因为 也 可 以 通过 有 限 次 Givens 变换 将 非 
零 向 量 x 的 ?一 1 个 分 量变 为 零 , 即 可 以 通过 有 限 次 Givens 变换 将 向 量 x 旋转 到 某 个 坐 
标 轴 上 . 

定理 3.5.4 对 任意 0 隆 x€ R", 存在 有 限 个 Givens 和 矩阵 的 乘积 T, 使 得 


Tx 一 十 |xle， 


其 中 e € R" 为 标准 单位 向 量 . 

另外 可 以 证 明 , 每 个 Givens 矩阵 可 以 分 解 为 两 个 
Householder 和 矩阵 的 乘积 . 吉文 斯 (James Wallace Givens， 
见 图 3- 15) 是 美国 数学 家 和 计算 机 科学 的 先驱 . 1936 年 ， 
他 以 “线性 空间 中 的 张 量 坐 标 ” 获 普林斯顿 大 学 博士 学 位 ， 
导师 是 易 易 大 名 的 韦伯 伦 C(Oswald Veblen,1880 一 1960, 美 
国 数学 家 和 拓扑 学 家 ,其 工作 被 应 用 于 原子 物理 和 相对 论 ， 
以 其 命名 的 Oswald Veblen 奖 是 数学 界 的 皇冠 ). 1958 年 ， 
他 发 表 “ 一 般 矩 阵 三 角 化 的 平面 西 旋转 变换 的 计算 ”一 文 ， 
提出 Givens 变换 . 他 还 参与 了 UNIVACI 和 ORACLE 等 计 
算 机 的 研制 ,并 担任 第 十 四 届 SIAM 主席 . 


图 3-15 吉文 斯 (1910 一 1993) 
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3.5.2 求 QR 分 解 的 Householder 变换 法 
根据 定理 3. 2. 3, 对 秩 为 7 的 任意 mr Xn 阶 矩 阵 A = (oa ,Gz ,…,@,)，, 存在 mm 阶 正 交 
R 二 R i 
矩阵 Q 和 Xn 阶 行 满 秩 矩阵 R, 使 得 4 二 Q()，, 因此 OTA 一 (0)， 即 和 矩阵 和 通过 正 交 


变换 @" 可 化 为 (0 ). 由 于 Householder 逢 阵 也 是 正 交 算 阵 ,而 正 交 什 阵 的 乘积 仍然 是 正 
交 和 矩阵 ,因此 我 们 可 将 正 交 和 矩阵 CT 分 解 为 一 组 Householder 和 矩阵 的 乘积 ,从 而 用 一 组 

Householder 变换 就 可 将 任意 矩阵 4 变换 为 上 三 角 和 矩阵 . 这 种 方法 的 具体 步骤 如 下 ;， 
第 一 步 ; 当 wm 了 关 0 时 ,存在 Householder 矩阵 本 ,使 得 (为 方便 说 明 , 不 妨 取 
正 号 ) 
机 ai =+aiei,e € R”, |al= |el 


二 al 这 
HiA 一 (Hiai ,Hao» ，… ,Hea,) 二 


0 Al 
如 果 mw 二 0, 则 令 HH = 一 工 , 直接 进行 下 一 步 . 

第 二 步 ,对 (一 1) X (一 1) 阶 矩 阵 4 三 (应 ，… 肥 ), 当 肥 夭 0 时 ,存在 Householder 
和 矩阵 古 ,使 得 


HP; 一 十 az el， | az | 3 | p; | 名 攻 民 ” 


be Dy 2 = XxX 
H,A'= (HP; , H,p; »*** ,Hp,) 一 
0 A 
1 OT 十 a xX 汪 
若 令 HH | , 则 有 五 ， HA = 十 aa |。 如 果 民 一 0， 则 令 H; 王 卫 
H, Pa 


直接 进行 下 一 步 . 

第 三 步 ,对 Gm 一 2) X (2 一 2) 阶 矩 阵 4; 继续 类 似 的 变换 ,如 此 至 多 mn 一 1 步 ( 当 mm 二 
n 时 至 多 nn 步 ), 也 即 至 多 可 以 找到 mm 一 1 个 Householder 矩阵 印 , Hi,…, HH ,使 得 

R 

Hi Hs HA = (0) 或 (RX). 

令 Q= (Ha H; HI) = HH Ht = HH… HH, 1, 则 Q 为 正 交 和 矩阵 ， 
从 而 由 上 述 算法 确实 得 到 A 的 QR 分 解 . 

例 3.5.3 利用 Householder 变换 求 矩 阵 4 的 QR 分解, 其 中 A 同 例 3.2.1. 

解 :对 向量 @ 二 (0,2,0)7, 令 二 @ 一 上 ole, 则 


Ld 


2 至 人 Wy == > | 万 
1 
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@ 1 名 
从 而 得 Householder 矩阵 Hi = 二 I 一 2wuiul = 二 1] 0 0|, 使 得 
0 0 1 
2 1 -6 
HA=|0!3 “1 
0:! 4 2 


注意 Hig 二 (2,0,0)", 即 @i 二 (0,2,0)7 被 Hi 反射 到 (2,0,0)7T, 而 ww 实际 上 是 镜 
射 平 面 一 + 十 y = 0 的 法 向 量 . 
对 向 量 记 = (一 3,4)7, 邻 二 = (一 2,1)7 (i 实际 上 是 平面 一 2y 十 z = 0 的 法 


3 4 
“5 5 1 0T 
问 量 ) ,可 得 Householder 矩阵 H; = 1 一 2 Ul 二 , 因此 取 H, 一 | 
Pe Er 2 
6 5 
1 0 0 六 4 
3 4 2 二 /一 5 5 
5 5 则 豆 豆 4=|0 5; 1j=R, 而 且 Q 二 HH 二 |1 0 0|, 故 所 
0 和 昌 0 oF 3 o 4 3 
5 5 5 5 


求 也 是 式 (3. 2. 4). 
注意 :在 Matlab 中 ,提供 了 内 置 函 数 house, 可 用 于 生成 Householder 矩阵 ,调用 格 
式 为 


Iv/beta,s] = gallery('house',x,k);H= eye(n) - betax ve Vv’ 
这 里 Hx 二 se1. 参数 有用 于 控制 beta 进而 控制 ;的 正 负 ,k 取 缺 省 值 0 时 所 得 的 互 就 
满足 
Hx =— sgn(é1)| xle; 
具体 可 查询 Matlab 中 的 测试 矩阵 库 gallery. 
尽管 函数 house 中 提供 了 实现 Householder 变换 的 各 种 选择 ,但 Matlab 在 实现 QR 
分 解 算法 时 ,似乎 为 简单 起 见 , 一 律 选择 了 投向 正 半 轴 . 


i 册 温 
六 总 
例 3.5.4 利用 Householder 变换 求 矩阵 4 的 QR 分 解 ,其 中 4 一 
多 名 
1 1 2 


解 :对 向 量 @ 二 (1,1,1,D", 令 二 @ 一 | 上 ale = 一 1,1,1,1)7, 则 
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V1 1 让 
一 了 
we 
于 是 Householder 和 矩阵 
1 1 1 1 
. | 1 一 1 一 1 
HH 一 了 一 2wuf 一 广 | 1 —1 
ii 1 =1 1 
六 | 向 站 
四 六 有 0! 0 0 
| 
01-1 一 1 
id 


对 向 量 应 = (0,0, 一 1)7, 令 i = 


2( 1,0, 一 1)"( 可 正 可 负 时 Matlab 选择 投向 


正 半 和 轴 , ws 实际 上 是 平面 x 十 z = 二 0 的 法 向 量 ) ,可 得 Householder 矩阵 


6 机 一 1 
H,=I—2%il=|0 1 0 
一 ] 而 站 
1 0 64 0 
0 WW 0 i 
tk | | 0 0 1 0 | "从 而 有 
6 —1 6 6 
2 Bl 
HHA-=- 0 111 | 
| 0 0!10l lol 
0 010 


由 于 向 量 y; = 二 (0,0)T， 故 令 H; 一 了 工 从 而 所 求 的 QR 分 解 为 


R R 
T T T T 
T 开工 -他 要 各 
1|1 1!1-1 -lllo 1 1 
1 1 lB 
1 -1!-1 1ljlo 0 0 


注意 到 ~(4) 二 2, 我 们 可 轻易 写 出 4 的 约 化 QR 分 解 . 
例 3.5.5 利用 Householder 变换 求 例 3. 2. 5 中 的 矩阵 4 的 QR 分解 . 
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1 1 
V2 VE 2YZ VB 

解 :计算 可 知 0 二 ,0 1 0 1,R 二 J0 0 1|， 
1 0 由 0 0 0 
V2 V2 


前 面 两 例 说 明 ,在 处 理 非 列 满 秩 和 矩阵 时 ,与 MGS 算法 相 比 , Householder 变换 的 优 
点 是 不 必 对 结果 进行 人 工 改动 . 


例 3. 5.6 ”利用 Householder 变换 求 矩 阵 4 的 完全 QR 分 解 ,其 中 A 二 ( 


, J BY /06 22 
解 :计算 可 知 2 一 (0 8 il 一 人 0.8 站 

在 文献 L[110] 中 ,Moler 给 出 了 grsteps 函数 ,其 中 涉及 如 何 基于 Householder 变换 实 
现 和 矩阵 A 的 QR 分 解 ,这 是 否 可 理解 成 是 对 Matlab 内 部 所 采用 算法 的 粗略 描述 呢 ? 


3.5.3 下 蛋 的 母 鸡 


有 英国 读者 极 爱 《围城 》 力 至 希望 面 见 钱 钟 书 先生 . 先生 答 日 :假如 你 吃 个 鸡蛋 觉得 
味道 不 错 , 又 何必 认识 那个 下 蛋 的 母 鸡 呢 ? 尽管 有 这 样 的 先例 ,但 就 伟大 的 Householder 
变换 而 言 ,我 们 必须 爱 蛋 及 鸡 ”, 去 看 看 “ 那 只 母 鸡 ”. 

豪 斯 霍 尔 德 (Alston Scott Householder, 见 图 3- 16) 
是 美国 艺术 和 科学 院 院 士 ,著名 的 应 用 数学 家 、 生 物 
学 家 和 和 矩阵 计算 专家 . 他 于 1925 年 获得 美国 西北 大 
学 的 哲学 学 士 学 位 ,两 年 后 获得 康 奈 尔 大 学 的 哲学 硕 “> 
士 学 位 . 1937 年 以 关于 变 分 法 的 研究 获得 芝加哥 大 学 | 睛 
的 数学 博士 学 位 之 后 ,他 从 事 了 8 年 的 生物 数学 研 台 
究 . 1946 年 ,他 加 入 美国 橡树 岭 国 家 实验 室 (ORNL)， 
并 很 快 成 为 数值 计算 领域 的 领军 人 物 . 正如 威 尔 金森 
所 指出 的 ,当时 人 们 关于 和 矩阵 计算 的 知识 处 在 一 片 混 
沌 之 中 . 尽管 人 们 提出 了 大 量 算法 , 却 没 有 关于 它们 
内 在 联系 的 系统 研究 . 正 是 豪 斯 霍 尔 德 通过 算法 分 图 3- 16 豪 斯 霍 尔 德 (1904 一 1993) 
类 ,证 明了 当时 很 多 算法 的 内 在 本 质 都 是 相同 的 ,从 而 在 混沌 中 引入 了 秩序 . 基于 他 的 
工作 ,人 们 可 以 将 矩阵 分 解 为 三 角 符 阵 、 对 角 符 阵 、 正 交 和 抢 阵 等 特殊 矩阵 的 乘积 ,进而 
可 以 开发 出 灵活 而 有 效 的 矩阵 计算 软件 包 . 他 的 工作 同时 也 大 大 加 快 了 舍 人 误差 的 研 
究 . 因此 ,他 的 这 项 成 果 采 列 “20 世纪 十 大 算法 ” 他 也 是 在 线性 代数 中 系统 地 使 用 范 数 
的 先驱 者 . 1958 年 ,他 提出 矩阵 的 Householder 变换 ,实现 了 高 效 、 稳 定 的 QR 分 解 . 
1964 年 ,他 出 版 了 矩阵 计算 领域 的 经 典 著作 《数值 分 析 中 的 矩阵 论 》. 该 书 用 一 种 统一 
的 视角 ,将 各 种 结果 引入 抢 阵 论 之 中 , 仅 参 考 文献 就 多 达 44 页 , 占 全 书 五 分 之 一 的 篇 
幅 . 毫 无 疑问 ,该 书 代 表 了 当时 数值 计算 领域 的 最 高 学 术 成 就 ,是 该 领域 的 学 生 和 研究 
者 的 必 备 文献 . 1986 年 出 版 的 中 译本 ( 见 图 3-17) 只 翻译 了 原 书 的 前 三 章 , 即 基础 
理论 部 分 . 1969 年 ,IEEE 计算 机 分 会 授予 他 Harry M，Goode Memorial 奖 , 以 表彰 他 在 


| 
48 © 2 
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应 用 计算 机 求解 大 规模 问题 的 数值 方法 等 方面 所 做 的 突出 
: 贡献 . 同年 ,他 离开 ORNL, 转 而 任教 于 田纳西 大 学 ,直至 
退休. 
各 在 矩阵 计算 领域 , 豪 斯 霍 尔 德 的 另 一 个 贡献 是 发 起 并 组 
织 了 多 次 Gatlinburg 研讨 会 . 后 来 ,为 表彰 他 的 贡献 ,1980 年 
后 该 研讨 会 改名 为 Householder 人 研讨 会 . 研讨 会 设 有 House- 
holder 奖 , 奖 给 3 年 来 在 数值 计算 的 重要 领域 中 最 优秀 的 博士 
论文 (每 次 只 有 1 一 2 名 ). 值得 一 提 的 是 ,我 国 矩 阵 计算 研究 的 
开拓 者 和 黄 基 人 蒋 尔 雄 先 生 任教 于 复旦 大 学 期 间 , 指 导 的 学 
生 徐 洪 国 的 博士 论文 获得 了 1993 年 国际 Householder 奖 . 当 
时 除了 该 生 外 ,亚洲 地 区 自己 培养 的 博士 生 中 尚未 有 人 获得 
图 3 17 《数值 分 析 中 的 过 该 奖 . 历经 20 年 岁月 匆匆 ,如 今 ,在 矩阵 计算 的 舞台 上 ,出 现 
邱 降 论 ? 中 译本 了 越 来 越 多 的 亚 毅 学 者 的 身影 


_3.6 本 空间 \ 本 变换 与 西 矩阵 


到 目前 为 止 ,在 内 积 空间 里 ,我 们 小心翼翼 地 尽量 避免 涉及 复数 ,这 是 因为 复数 远 比 
实数 复杂 ,而且 实数 又 是 特殊 的 复数 ,这 意味 着 关于 复数 的 结论 对 实数 也 应 当成 立 , 当然 
反之 未 必 . 从 实数 到 复数 在 某 种 程度 上 也 是 一 种 推广 . 比如 考虑 复数 > € C? 的 模 ,由 于 
(zz) 一 |z|’ 二 之 二 zz 二 (z,z), 因此 仅 适 用 于 欧 氏 空间 的 定义 3. 3. 1 必须 做 适度 修 
改 . 尽管 如 此 , 当 欧 氏 空间 中 向 量 的 坐标 分 量 的 取 值 由 实数 域 推广 为 复数 域 时 ,向 量 的 内 
积 \ 标 准 正 交 基 、 向 量 元 素 之 间 的 正 交 变换 等 概念 和 结论 都 可 以 “平滑 地 ”推广 到 复 内 积 
空间 . 所 以 欧 氏 空间 与 复 内 积 空 间 中 的 相关 结论 几乎 是 平行 的 ”. 

定义 3.6.1 设 V 是 复数 域 C 上 的 线性 空间 . 如 果 对 V 中 任意 向 量 a ,BE V, 按照 
某 种 对 应 规则 ,都 存在 唯一 的 复数 (a,p) € C 与 之 对 应 ,并 且 这 种 对 应 还 满足 下 面 四 个 
条 件 : 

Q) 共 固 对 称 性 :对 任意 ,BP EV, 都 有 (a,PB) = (Bo); 

(2) 左 齐 次 性 :对 任意 @,B EV 和 任意 %* E C ,都 有 Ga;P) 二 4 (a,P); 

(3) 左 可 加 性 :对 任意 @,B,Y EV, 都 有 (a 十 B,Y) 二 (xy) 十 (8,7) ; 

(4) 正 定性 :对 任意 a EV, 都 有 (a,@a) 三 0, 当 且 仅 当 @ == 0 时 ,等 号 成 立 . 
则 称 (a,PB) 为 wx 与 厅 的 内 积 , 称 定义 了 内 积 的 线性 空间 V 为 复 内 积 空间 ,也 称 为 酉 空间 
(unitary space). 
几 点 注意 : 
(1) 一 般 将 欧 氏 空间 与 西 空间 统称 为 内 积 空 间 ; 
《2) 当 (wx, 有 是 实数 时 共 轿 对 称 性 就 特殊 化 为 对 称 性 ; 
(3) 从 定义 看 ,内 积 实 际 上 是 一 种 映射 , 即 (.,.):VXVPDPC; 
(4) 向 量 空间 C” 中 的 标准 内 积 (x,y) 是 


(X39) = zn 二 Tw 二 wy = yx 
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其 中 x 二 (ziyz2*yT4) 和 ?了 一 (yn 六 为 CC 中 的 任意 向 量 , 六 二 (y)' 是 向 
量 y 的 共和 因 转 置 . 

(5) 西 ( 音 y6u) 是 unitary 的 音译 ,而 unitary 的 词根 是 unit, 表 示 万 数 之 首 ,因此 西 空 
间 也 就 有 了 各 类 空间 的 根基 所 在 的 韵味 ,这 充分 反映 了 希 尔 伯 特 的 上 哲学 思想 . 译 者 译 以 
天 干 地 支 中 的 “ 西 ”, 的 确 音 神 兼备 . 当然 , 如 果 你 有 不 同 看 法 ,等 以 后 有 机 会 碰 到 希 尔 伯 
特 先生 ,可 以 与 他 切磋 一 下 . 

到 目前 为 止 ,我 们 已 接触 了 向 量 空间 、 线 性 空间 、 欧 氏 空间 、 内 积 空间 等 “二 八 佳 人 ”， 
她 们 个 个 “ 国 色 天 香 ”、“ 美 艳 动 人 ”. 事实 上 ,在 布尔 巴 基 学 派 创 立 的 现代 结构 数学 里 ,这 
样 的 “佳人 ”比比 皆 是 ,她 们 之 间 的 层次 关系 如 图 3 - 18 所 示 . 


U U 
拓扑 线性 空间 
U U 
距离 空间 。 | 二 | 距 高 线性 空间 | 二 
U UU 
U U 
内 积 空间 “| 福 
U 


欧 氏 空间 ( 及 * 和 C”) 


图 3- 18 各 类 空间 的 层次 关系 


例 3.6.1 在 向 量 空 间 C" 中 ,对 任意 x,yE C" 及 任意 4 € C” (这 里 要 求 48 一 
A ), 则 


(Ax,y) = yAx 


是 C" 的 一 个 内 积 , 称 为 x,y 的 复 双 线性 型 (bilinear form) , 记 为 [x,y], 其 中 A 一 (4)7 
是 和 矩阵 的 复 共 轿 转 置 矩 阵 . 

我 们 称 满足 A" = A 的 矩阵 A € C” 为 Hermite 矩阵 , 称 满 足 48 = 二 一 A 的 矩阵 A € 
C™ 为 反 Hermite 矩阵 . 显然 复 双 线性 型 是 实 双 线性 型 的 推广 , Hermite 矩阵 是 实 对 称 
矩阵 的 推广 , 反 Hermite 矩阵 则 是 反对 称 和 矩阵 的 推广 . 

定义 3. 6.2 如果 酉 空间 Y 中 的 线性 变换 7 保持 向 量 的 内 积 不 变 , 即 对 任意 w,P E 
V, 有 

CT 0 ,TBD = Cm 


则 称 7 为 酉 变换 (Cunitary transformation). 
根据 定义 , 酉 变换 也 保持 西 空间 中 向 量 的 长 度 、 距 离 等 几何 属性 不 变 ,因此 西 变 换 是 
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正 交 变 换 的 推广 .不 过 ,对 西 空间 中 两 向 量 间 的 夹 角 , 则 不 易 定义 ,因为 此 时 内 积 (c, 有 ) 
是 复数 . 

定理 3.6.1 设 T 是 西 空间 V 上 的 一 个 线性 变换 , 则 下 列 命题 是 等 价 的 : 

(1) 厂 是 西 变换 ; 

(2) 丁 保持 向 量 的 范 数 不 变 , 即 17Co)| = al; 

(3) 若 81,82，,… ,gs 是 V 的 一 组 标准 正 交 基 , 则 T (si),7T (se),…,T (ss) 也 是 V 的 标 
准 正 交 基 ; 

(4) 了 在 V 的 任意 一 组 标准 正 交 基 下 的 矩阵 UU 为 酉 矩阵 Cunitary matrix) , 即 

UU = UU"=1 

显然 , 西 和 矩阵 是 正 交 和 矩阵 的 推广 . 请 读者 注意 不 要 混 消 丁 矩 阵 与 Hermite 矩阵 . 

西 空间 V 还 有 以 下 一 些 重要 结论 : 

(1) 右 共 恩 齐 次 性 : (ac,Ap) 二 XCa, 户 . 

(2) (xc, 8 二 7) = (a,P) 十 Ca,7Y). 

(3) (@,0) = (0,8) = 0. 


(4) Cauchy-Schwartz 不 等 式 (注意 左 侧 是 复数 (c, 甩 的 模 ) : 
| (ap | lol: lpl 
证 明 : B= 二 9 时 显然 成 立 . 设 B 关 0, 则 
0<la—#Bl: = (a—kp,a—hkB) = (oa) 一 Ex 有) 一 ECB,a) + E(B,P) 


在 上 式 中 , 令 上 一 i 并 注意 到 | =| :一 云 , 则 


(a,B) (B,a) 2 | (a |? 
0 (a,a) 
Co (5.8) lal [pl 


整理 后 即 得 Cauchy-Schwartz 不 等 式 . 
(5) 向 量 w 的 长 度 为 上 a|== V(a,a) ,并 且 满 足 三 角 不 等 式 


la+pl< lal+ lgl 
证 明 :|a+pl? 三 (xc 十 Ba 十 及 二 (wo) 十 (xc, 有 十 (Bo 十 (8,B) 
一 (x,o) 十 2Re(Cax, 有 十 (8 有 和 (xc,w) 十 2| (a,p) | + Bp,P) 
<leal’:+2lal 8 二 18 本 二 (Cell 二 15812 
其 中 , Re(@a,B) 表示 (a,PB 的 实 部 . 
(6) 当 两 个 向 量 @,B 的 内 积 (c, 有 =0 时 , 称 w 与 有 正 交 . 
《7) 线 性 无 关 向 量 组 都 可 以 用 Schmidt 正 交 化 方法 正 交 化 ,并 扩充 成 一 组 标准 正 交 基 ， 
也 就 是 说 , 列 满 秩 的 复 抢 阵 4 存 在 UR 分解 , 即 存在 半 丁 矩阵 U( 即 UBU = 二 I 或 U0? 二 了) 和 
对 角 元 为 正 数 的 上 三 角 和 矩阵 ( 称 为 正 线 上 三 角 和 矩阵 ) R, 使 得 
A=UR 


(8) 标 准 正 交 基 gi ,sg;,…,s, 下 任意 两 向 量 的 内 积 为 
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(a,PB) 和 寺 洲 1 十 zyz i 二 Yn 2 yx 


其 中 x 二 (zi, ,7) 和 y= 二 《y1,y2，… ,yn) "分别 是 ,的 坐标 向 量 , 即 V 中 向 量 的 
内 积 仍然 转化 为 坐标 向 量 的 内 积 , 也 就 是 C” 中 的 标准 内 积 . 
(09) 任意 一 个 西 空间 V 都 可 以 正 交 分 解 为 其 子 空间 Vi 和 Vt 的 直 和 , 即 V 二 Vi Vi. 
(10) 两 组 标准 正 交 基 间 的 过 渡 和 矩阵 是 丁 矩 阵 . 
例 3. 6.2 本 和 抢 阵 的 道 矩 阵 仍然 是 酉 矩阵; 西 矩阵 的 乘积 仍然 是 丁 和 矩阵 . 
例 3. 6.3 证明 :(1) 西 矩阵 的 特征 值 之 模 为 1; (2) 丁 矩阵 的 相 异 特征 值 对 应 的 特 
征 向 量 互相 正 交 . 
证 明 :(1) 设 西 和 矩阵 局 有 特征 对 (0,z, 即 Uxr 二 x, 则 xH09 一 Kxa. 由 于 DaU 一 并 故 
xzHx 一 XUHUx 一 从 xx 注意 到 xtix 二 上 xl? 之 0, 因 此 对 =1, 此 即 | 1|=1， 
(2) 设 酉 矩阵 D 有 特征 对 (AM,xz) 和 (xy), 是 天 六 则 yaU8 一 去 虽 , 故 
六 二 yaUHUx 一 Xr yx 
显然 , 当 轴 关 1 时 即 得 yx 二 0, 也 就 是 x 与 y 正 交 .事实 上 ,车 及 二 1, 则 和 二 
Al4|? 二 jy. 注意 到 |y| = 1, 因此 4 二 yy, 与 已 知 矛盾 . 证 毕 . 
例 3.6.4 若 $,T 分 别 是 实 对 称 矩 阵 和 实 反对 称 和 矩阵 , 且 det(I1 一 T 一 5) 了 关 0, 则 
U= (4+T+4iS) GT 一 T 一 213) 
是 西 矩 阵 . 
解 :由 题 可 知 Sa 一 S, 到 一 一 T 及 (1S)8 一 一 和 9 ,注意 到 A "二 (41) 7! 一 (4 1)H, 则 
UU 一 [GI 二 TiS) (I—T—iS) (+HT+iS) (GT 一 T 一 213) 
= (T 一 T 一 和 3)- (I+T+iS)F (HT+HiS) (I—T—iS)7! 
= (I+T+iS) (I—T—iS)(I+T+iS) (一 T 一 213) 
= (I 二 TiS) (THiS)(I—T—iS) (一 T 一 13) 
= (I—T—iS) (I—T—iS$) =I 


其 中 用 到 的 等 式 (I 一 T 一 iS)(I 十 T 十 iS) 二 (I 十 T 十 i5)(I 一 T 一 iS$)，, 验算 即 知 是 成 立 的 . 


习 题 三 


3.1 求 欧 氏 空间 展 ! 中 与 wi 一 (1,1, 一 1,1)7,os 一 (1 一 1, 一 1,1)7,as 一 (2,1,1,3)7 
都 正 交 的 单位 向 量 . 

3.2 已 知 两 个 线性 无 关 的 nn 维 (n 宇 4) 向 量 组 ():; Qi ,gs 和 (I]D): ,PB;， 且 两 向 量 组 正 
交 ,证 明 : ol ,2z， Pp ,应 线性 无 关 . 

3.3 试 把 mi 三 (1;0,1,0)1,os 一 (0,1,0,2)T 扩充 为 展 : 的 一 组 正 交 基 , 再 改造 成 民 : 的 
一 组 标准 正 交 基 . 

3.4 证 明 任 意 二 阶 正 交 和 矩阵 , 必 取 下 列 两 种 形式 之 一 : 

人 COSO | me sing 


一 元 0 声 
sing 一 人 


一 SinO cosO 
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3.5 


试用 MGS 算法 求 短 阵 A 的 QR 分 解 ,其 中 : 


0 4 1 ] 间 1 1 a@ | 
(DA= Il 1 1 (20)4= 11 1|;(3)A=|I2 1 1|;(4)A= Il 2 0|. 
0 3 2 vy 1 @ 2 0 0 1 


判断 命题 3. 2. 1 的 真 伪 . 如 果 式 (3. 2. 7) 不 正确 ,那么 正确 的 结论 又 是 什么 ? 
设 w 王 (zz) 8 一 (my ER 民 ?,， 判 断 民 :对 下 列 内 积 定 义 是 否 构成 欧 氏 
空间 : 

(1) (ag,P) = Ziyi 一 Zzyzs 

(2) (@,PB) = 3z1y1 + x2 y2; 

(3) (@,P) = | ziy 十 zyz|. 


设 = (Zi 9 并 2 ,一 (Yi Vy2 9 Yn ) € R"， 证 明 (a,P) > Dkriys 是 R” 
k=] 
的 一 个 内 积 ,并 写 出 相应 的 Cauchy-Schwarz 不 等 式 . 


证 明 : 对 任意 AE Rw 及 BE R”*, 有 tr(4B) = tr(BA). 


证 明定 理 3. 3. 2. 及 定理 3. 3. 3. 
设 (D:o 一 (1,1)7os 一 (1, 一 1)7 及 (ID: 记 一 (0,2)7, 访 一 (6,12)7 为 欧 氏 空 
间 民 * 中 的 两 组 基 , 且 

(CC ,Pi) st 1, (ai ,应 ) == 15,(@; ,Pp ) =— 1,(@; ,pb;) 一 3 
求 :(1) 基 (1) 和 基 (1]) 的 度量 矩阵 ;(2) RR* 的 一 组 标准 正 交 基 . 
设 Ql 02 Oy 为 欧 氏 空间 V 的 一 组 基 , 其 度量 矩阵 为 A, V 中 向 量 组 所 ,Pb ,，*…,， 
及 满足 

(所 ,PB ,*… ,Bp,) = (Ca ,0 ，… ,0 ) 卫 ， P € R”™™ 

证 明 : Bb ,Pp ,Pp, 是 V 的 标准 正 交 基 的 充 要 条 件 是 PUP 一 了 
证 明 函 数 空间 CL0,1] 中 的 函数 组 z,er ,zez 是 线性 无 关 的 . 
已 知 欧 氏 空间 民 ”? 的 子 空间 双 一 { 居 一 (zy) | zu 一 zzzyzlz 二 za) 及 V 中 的 线 
性 变换 


S 本 
TX) = XP +X!, XeVP= (1 ,) 
求 V 的 一 组 标准 正 交 基 , 使 得 7 在 该 基 下 的 矩阵 为 对 角 和 矩阵 . 
在 民 [xj 在 下 列 内 积 定义 下 的 一 组 标准 正 交 基 : 


1 

C1) (fyg) = | fr) gC) de ; 
1 

(2) (f,g) =| f(r)g(r)dr; 


十 oo 
(3)【〔〈 太 g92 | f(x)g(rxr)e dz. 
0 
已 知 g1、g2\83 是 欧 氏 空间 V 的 一 组 标准 正 交 基 , 且 


wi = 了 (28 -2 = sy = 3 C28, Ba | Besy 
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求 ga, 使 ol az .os 也 是 V 的 一 组 标准 正 交 基 . 

设 @i,0@2，……,Q, 为 欧 氏 空间 V 的 一 组 基 . 证 明 : 

(1) 如 果 @ EV 使 得 (gs@;) 二 0,1 一 1,2,…,n, 那么 一 0; 

(2) 如 果 @,B EV 使 得 对 任意 Y EV, 都 有 (a,Y) 一 (1.7Y) 一 0, 那么 gag 二 pp. 
(Parseval 等 式 ) 设 gl ,Qs，…,@, 为 欧 氏 空间 的 一 组 标准 正 交 基 ,对 任意 @,Pp E 
V，, 证明: 


(1) (PB) = > Cas0) CB,B); (2) el = > Casa)2. 
i=1 1 一 1 


(Bessel 不 等 式 ) 设 ol ,oz ,……,ax 为 欧 氏 空间 V 的 一 组 两 两 正 交 的 单位 向 量 ,对 任 
意 cx EV, 证明: 


k 
(1) 2) (ao) < lal’; 
t=] 


天 
(2)Y 一 一 >)(a,oi)a, 与 每 个 @; 都 正 交 (i = 二 1,2,…,k). 
:=1 


设 @ 一 (1,0,2,1) ,oz = (2,1,2,3)',@; = (0,1, 一 2,1)T，Ww = span{al ,as2， 
03}. 求 VL 的 一 组 基 . 
设 & 关 9 为 n 维 欧 氏 室 间 V 中 的 一 个 固定 向 量 ,证 明 : Vi = {@ | (g,&) ==0,0 € 
V}) 的 维 数 为 n 一 1. 
设 Vi,Vi 为 n 维 欧 氏 空间 V 的 两 个 子 空间 , 且 V 二 Vi 四 V,. 证 明 ;:V 二 Vi@V， 
的 充 要 条 件 是 Vi 与 Vs 的 基 互相 正 交 . 
设 Vi,Vz 为 欧 氏 空间 VV 的 两 个 子 空间 ,证 明 :; (Vi 十 Va)1= V+ 站 上， 
Vi NN = Wt 十 玉 +, 

21—1 1 
1 1 一 2 —1 
设 AE C2 且 74) 二 xr(4). 证 明 :(1) NG) 十 RQ) = {0); (2) C" 二 NOQ)O RA). 
证 明 Fredholm 定理 :线性 方程 组 Ax = 一 b(AE C”” ) 有 解 的 充 要 条 件 是 向 量 廊 E 
C” 与 齐 次 线性 方程 组 Ary 一 0 的 解 空 间 正 交 . 
分 别 使 用 法 方程 法 和 QR 分 解法 求 不 相 容 线性 方程 组 Ax 二 b 的 最 小 二 乘 解 ， 
其 中 : 


求 NCA) 的 一 组 标准 正 交 基 及 N (4)L 的 一 组 标准 正 交 基 ,其 中 人 一 ( 


| LL 1 性 2 
1 1 2 i, 9 1 
@ 1 1 3 
(])4 王 |1 —1|,b6=|1|;(2)A=|1 0|,6=|5|;(3)4A= 四 一 | |. 
让 学 工 5 
1 1 0 6 
下 71 6 


求 经 过 下 列 数据 点 的 最 佳 直 线 和 最 佳 抛物 线 : 

(1) (0,0),(1,3),(2,3),(5,6); (2) (1,2),(3,2),(4,1),(6,3). 

对 欧 色 空间 V 中 的 任意 向 量 w E V 和 某 个 固定 向 量 wo E V, 定义 平移 变换 为 ， 
A 人 1f:a PG 十 Qo. 试问 :平移 变换 人 是 不 是 正 交 变 换 ? 为 什么 ? 

设 oil ,ao ,On 为 欧 氏 空间 交 的 一 组 标准 正 交 基 , 且 ou 一 ol 十 20s 十 … 十 ma,， 
证 明 : 线 性 变换 了 (ao) 一 w 十 Raoo)oo (R 兴 0) 是 正 交 变换 当 且 仅 当 人 一 
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2 
十 2 十 … 十 m2 
设 oli ,os ,os 为 欧 民 空间 V 的 一 组 标准 正 交 基 , 求 V 的 一 个 正 交 变换 古 , 使 得 
T(t) 三 3 (doa — Boy to}, Tw) = $ C20 Fo — 20) 
设 Qi ,G2,… ,0 和 忆 , 房 ,…, 忆 为 n 维 欧 氏 空间 V 的 两 个 线性 无 关 向 量 组 ,证 明 ; 存 在 
正 交 变换 了 ， 使 得 了 (ai) 一 及 的 充 要 条 件 是 (Cr ,0; ) (及 ,PB;) ( i,7 = 1 ,2v ,A ). 
证 明 每 个 Givens 短 阵 可 以 分 解 为 两 个 Householder 矩阵 的 乘积 . 
设 韭 是 n 阶 Householder 短 阵 ,证 明 块 对 角 短 阵 百 一 diag(L,, 昌 ,1) 也 是 House- 
holder 给 阵 . 
设 G 是 nn 阶 Givens 天 阵 , 再 , 末 是 郊 阶 Householder 和 矩阵, 证明 GHG-!' 和 HHH 
都 是 Householder 短 阵 ， 
试用 Householder 变换 法 求 矩 阵 A 的 QR 分 解 ,其 中 A 同 习题 3. 5. 
( 极 化 恒等式 ) 对 西 空间 V 中 的 任意 向 量 a 、p, 证 明 : 
Gap = 43atpl —le—pl:+iletipl’ —ile—ipl’) 


设 A,BE C”", 且 对 任意 的 x,y EE C", 都 有 (x,Ay) 二 (Bx,y), 证 明 : B= 二 AT. 
对 任意 A,BE C”, 验证 (A,B) 一 trCBHA) 为 Co 的 一 个 内 积 . 
设 A,B EE R”". 证明: 给 阵 U 二 A 十 iB 是 西 和 矩阵 的 充 要 条 件 是 矩阵 R 一 
A 一 及 。 
名 六 ) 是 正 交 矩阵 . 
证 明 : 酉 空间 V 中 的 向 量 ww 及 正 交 的 充 要 条 件 是 对 任意 复数 = zu， 成 立 

[za +wpl= |zel+t lwpl 

:1 

〈 复 矩阵 的 UR 分 解 ) 已 知 矩 阵 4 一 人 0 求 西 矩阵 U 和 上 三 角 答 阵 R, 使 得 


A= UR. 


下 4 二 
特殊 变换 及 其 矩阵 


在 矩阵 分 析 与 计算 中 ,活跃 着 大 量 的 特殊 和 矩 阵 , 她 们 仿 若 千姿百态 的 各 色 美 女 , 有 上 
(下 ) 三 角 和 矩阵 ,三 对 角 和 矩阵 、 带 状 和 矩阵 、 对 称 和 矩阵 、Hermite 矩阵 、 正 交 和 矩阵 、 西 矩阵 、 正 规 
矩阵、 投影 矩阵 、Toeplitz 和 矩阵、Frobenius 和 矩阵、 Vandermonde 和 矩阵.Z 矩阵、M 矩阵、 
H 和 矩阵 、 对 角 占 优 和 矩阵 , 非 负 抢 阵 、 友 矩阵. 协 方差 矩阵 、 随 机 和 抢 阵 Hamilton 矩阵 、 辛 矩 


阵 、Hilbert 矩阵 .Cauchy 矩阵、Leslie 矩阵 、 守 等 矩阵 、 过 堆 矩阵、 循环 矩阵 …… 真是 “ 乱 

花 迷 人 了 眼 ”. 矩阵 即 变换 , 当 她 们 开始 “ 凌 波 微 步 , 转 目 流 睛 ”之 时 ,更 是 迷 倒 一 干 书生 . 
4.1 正规 变换 与 正规 矩阵 

pre ERROREEEEISDE 瑟 2rETEEREEREREEEE3 瑟 TEST 


正规 变换 (正规 和 矩阵) 可 以 说 是 对 称 变 换 ( 对 称 和 矩阵 )、 正 交 变 换 ( 正 交 和 矩阵) 、 丁 变换 
(本 和 矩阵) 等 的 推广 和 抽象 , 它 关 心 的 是 个 永恒 的 主题 , 即 矩阵 “对 角 化 ?的 问题 . 这 又 一 次 
体现 出 了 现代 数学 高 度 的 抽象 和 统一 . 


4.1.1 正规 变换 


我 们 知道 , 方 阵 A,B 互 逆 的 充 要 条 件 是 AB = BA 二 I 从 纯 代 数 角 度 看 ,如 果 去 掉 
乘积 为 单位 矩阵 的 限制 ,那么 两 方 阵 是 可 交换 矩阵 .可 交换 和 矩阵 太 过 宽泛 ,这 一 网 撒 得 
大 了 些 .联想 到 正 交 和 矩阵 的 逆 即 为 其 转 置 ,因此 如 果 再 限定 两 矩阵 互 为 转 置 , 即 要 求 成 
立 AA' 二 A'A, 情况 又 如 何 ? 

显然 ,对 称 和 矩阵 (4A' 二 A) 和 反对 称 和 矩阵 (4 = 一 A) 都 满足 要 求 , 正 交 和 矩阵 (474 三 
AA' 王 当然 也 满足 这 个 要 求 . 因此 具有 性 质 A'A 二 A4” 的 这 种 新 矩阵 就 "一统 江湖 ”， 
具有 了 统一 性 . 

对 称 和 矩阵 最 主要 的 性 质 是 可 以 相似 对 角 化 ,尤其 是 可 以 正 交 对 角 化 , 即 通 过 相似 变 
换 或 正 交 变换 可 化 为 对 角 和 矩阵 ,推广 到 这 种 新 矩阵 后 ,这 个 性 质 是 否 还 能 保留 呢 ” 其 他 
性 质 又 如 何 呢 ? 

定义 4.1.1 对 于 实 方 阵 4,B, 如 果 存 在 正 交 和 抢 阵 O, 使 得 


QA40=0"'A0=B Ch. 1 1) 


则 称 A 正 交 相似 于 B, 并 称 矩 阵 8 为 正 交 相似 矩阵. 
定义 4.1.2 对 于 复方 阵 A,B, 如 果 存 在 酉 矩阵 U, 使 得 
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UAU=U AU 一 也 (4. 1. 2) 


则 称 4 下 相似 (unitary similar) 于 B, 并 称 和 矩阵 习 为 本 相似 矩阵 . 
上 述 两 定义 中 ,显然 西 矩 阵 与 正 交 矩阵 对 应 , 西 相似 与 正 交 相似 对 应 . 我 们 可 将 正 交 
相似 看 作 特 殊 的 酉 相似 . 
请 注意 正 交 相似 与 正 交 变换 的 区 别 和 联系 .事实 上 , 若 令 
So:4H 当 一 OI40 =O 40 (0 
显然 易 证 So 是 民 ” 中 的 线性 变换 ,并 且 对 任意 A411,As € RR , 按 RR 的 标准 内 积 , 有 


(Sa(A1),S0(h;))= (QAQ,0'A,0) = tr(Q'AiQ0'AIQ) = tr(0'A!AIQO) 
= tr(A3A100') = tr(A14A1) = (4 ,A,) 


即 Sa 也 是 正 交 变换 . 当然 ,从 形式 上 可 将 正 交 相似 看 成 对 矩阵 A 做 了 两 次 正 交 变换 , 即 
在 A“ 两 侧 ” 分 别 做 了 正 交 变换 8' 与 8, 因此 Sw 也 可 理解 成 这 两 个 正 交 变换 的 “合成 ” 
今后 为 投 述 方便 ,我 们 有 时 也 称 和 矩阵 A 被 8 正 交 变换 成 矩阵 召 . 对 西 相似 及 酉 变换 也 存 
在 类 似 的 区 别 和 联系 . 
定义 4.1.3 对 酉 空间 Y 上 的 线性 变换 了 , 如 果 存 在 V 的 一 组 标准 正 交 基 si， 
8 ,8 及 对 角 和 矩阵 人 三 diagCi ,2，…,)， 使 得 
(7 (gl1)， Ts ) (8)) = (81 ,623° 5 ) 人 (4., 1. 4) 


则 称 工 为 VY 上 的 一 个 正规 变换 (normal transformation) ,并 称 T 了 在 任意 标准 正 交 基 四 ， 
7 ，… ,1 下 和 矩阵 为 正规 矩阵 Cnormal matrix). 

显然 ,上 述 定义 中 的 对 角 和 矩阵 A 也 是 正规 矩阵 . 

定理 4.1.1 正规 变换 在 不 同 标准 正 交 基 下 的 正规 矩阵 是 西 相似 的 . 

证 明 : 设 正规 变换 芽 在 西 空间 V 的 两 组 标准 正 交 基 El ,ez ，…,a 和 太 , 太 ,…, 下 下 的 
矩阵 分 别 为 4 和 B, 并 设 (th;, 咀 … 11) 一 (88 8)U, 则 过 渡 和 矩阵 辟 是 西 和 矩阵 (请 
读者 自 证 ). 

由 于 (TO) TO) TD)) 一 (人 7 及， 又 

(TOT TD) = Tp = Tg E IU) 
一 (7T (8),T Cg ) 78))UT( 为 什么 ?) 
一 (81 254U = Gm np) UNAU 


所 以 B = 二 UMAU. 证 毕 . 
由 此 定理 易 知 ,正规 矩阵 4 必定 西 相似 于 一 个 对 角 阵 和, 即 存在 西 和 矩阵 U, 使 得 
UH4U = U7AU 一人 , 也 就 是 


4 一 UAU =UAU' (4. 1. 5) 
我 们 称 式 (4. 1. 5) 为 正规 矩阵 4 的 谱 分 解 (spectral decomposition). 
4. 1.2 正规 矩阵 
任意 复方 阵 A 通过 相似 变换 P 可 化 成 特殊 的 Jordan 矩阵 了, 即 PTAP == J 但 可 首 
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矩阵 王 一 般 不 易 求 着 . 如 果 王 特殊 化 为 易 求 逆 的 酉 矩阵 避 , 那么 Um 4U 又 是 什么 样 的 特 
殊 矩 阵 呢 ? 结果 肯定 比 J 更 一 般 些 . 考虑 到 J 是 特殊 的 带 状 矩阵 或 上 三 角 和 矩阵 , 因此 
U™'AU 是 不 是 也 是 带 状 矩阵 或 上 三 角 和 矩阵 呢 ? 

定理 4.1.2 (Schur 引 理 ) 任 何 复方 阵 A 必 西 相似 于 一 个 上 三 角 阵 了 , 即 存在 西 矩 
阵 UU, 使 得 

UAU=U AU=T (4. 1.6) 

证 明 : 对 和 矩阵 的 阶 数 ”做 归纳 法 . 

当 二 1 时 定理 显然 成 立 . 设 n 二 上 一 1 时 定理 成 立 , 考 虑 二 时 的 情形 . 

设 Qt ) 为 k 阶 和 矩阵 4 的 一 个 特征 对 ,并 且 wi 为 单位 特征 向 量 . 以 为 第 一 列 , 将 
Ul 扩充 为 阶 西 和 矩阵 Ui = (Ui Uz, ,Ui), 则 


AL 一 (Au , Al, AD) 人 (CA AU; ,*** ,Al ) 


k 
由 于 w ,ww，… ,ui 是 C* 的 一 组 标准 正 交 基 , 所 以 Au; = DY ayu; (i 二 2,3,…,k). 因 此 
j=1 


A Xx 
AI 一 (Ui y U2 »°°* Ui) 


0 A 


其 中 有 二 (ay) (5,t 二 2,3,…,k ) 为 & 一 1 阶 和 矩阵 . 根据 归纳 假设 ,存在 & 一 1 阶 酉 矩阵 辟 ， 
和 上 & 一 1 阶 上 三 角 和 矩 阵 卫 ,使 得 U8AiU, 一 卫 . 邻 Ui = diag(1,D,),U = 二 UiU, 易 证 U， 
和 都 是 & 阶 酉 矩阵 ,从 而 


Al A1 Xx 
UAU= UBSUFAUIU, = USUNU, 0 = > 
1 0 A 
1 Pe Ai 党 A XX 
Us 0 Al U; 0 DS AiU, 0 T, 
证 毕 
由 式 (4. 1. 6) 易 知 
A = UTU™ (4 7) 


我 们 称 式 (4. 1. 7) 为 任意 复方 阵 4 的 Schur 分 解 (schur decomposition). 

根据 Schur 引 理 ,可 得 正规 矩阵 的 一 个 美妙 性 质 ,也 即 前 面 提 到 的 等 式 447 = ATA， 
它 经 常 被 当成 正规 矩阵 的 等 价 定义 . 

定理 4.1.3 方 阵 A 是 正规 的 , 当 上 日 仅 当 A4" = 4HA4. 

为 证 明 这 个 结论 ,必须 再 给 出 一 个 引 理 . 

引 理 4.1.1 满足 TT 二 THT 的 三 角 阵 T 必 是 对 角 阵 . 

证 明 : 对 上 三 角 阵 T 二 (4 ), 比较 等 式 TI 一 THT 两边 的 乘积 矩阵 在 第 (i,i) 位 置 
上 的 元 素 , 并 注意 到 二 0G 放 门 , 则 对 i 二 1,2,…sn, 有 ||| 十 … 十 ||? = |4|? 
十 *… 十 | 喜 |:. 当 i 二 1 时 ,有 |tu|? 十 1512 十 十 | | 2 = ||’, 故 己 一 0G 一 2， 
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3,…,n). 对 i 施行 归纳 法 可 得 t; = 0(i 过 站. 证 毕 . 

现在 给 出 定理 4. 1. 3 的 证 明 如 下 : 

定理 4. 1. 3 的 证 明 : 必 要 性 . 如 果 A 是 正规 矩阵 ,那么 存在 谱 分 解 A 二 UALI, 因此 

AAF = (UAU) UAUD™ = UAA U™ = UAAU®™ = (UAU®) (UAU®) = AHA 

充分 性 . 根据 Schur 引 理 ,存在 4 的 Schur 分 解 A = 二 UTU™. 由 于 

448 = (UTU®) (UTUH)8 = UTUNUTHU® = UTTHUY ,AHA = UTHTUR 

因此 A4" 二 A?A 等 价 于 TT? 一 TYT, 根据 引 理 4. 11,T 了 是 对 角 和 矩阵 . 故 4 是 正规 条 
阵 . 证 毕 . 

至 此 ,我 们 可 以 用 更 方便 的 等 价 定义 445 二 4H4 来 判定 一 个 矩阵 4 是 否 为 正规 矩 
阵 . 特别 地 ,可 以 用 44 一 4 4 来 判断 一 个 矩阵 是 否 为 实 正规 矩阵 . 矩阵 即 变 换 , 但 在 这 
里 矩阵 视角 反而 比 变换 视角 优越 . 

例 4.1.1 判断 下 列 矩 阵 是 不 是 正规 矩阵 : 

(GD) 实 对 称 和 矩阵 (4 一 4); 

(2) 实 反对 称 和 矩阵 (4 一 一 A ); 

(3) 正 交 和 矩阵 (4T 一 4 ); 

(4) 丁 矩阵 (48 一 4- ); 

(5)Hermite 矩阵 (4 一 4 ); 

(6) 反 Hermite 矩阵 (4 二 一 A ); 


1 一 二 
(7) 形 如 a( ， ) 的 矩阵 ,其 中 a € C. 


解 : 按 定理 4.1.3 逐一 验算 A4" 二 A"A( 复 矩阵 ) 或 44' 一 4I4( 实 矩阵 ) 成 立即 可 . 
唐 高 祖 武 德 年 间 ,“( 唐 太宗 ) 私 幸 端 门 , 见 新 进士 级 行 而 出 , 喜 日 : 天 下 英雄 人 吾 载 
中 矣 1”” 举 几 对 称 和 矩阵 、 正 交 甜 阵 、 酉 和 矩阵 等 诸 般 和 矩阵 ,尽管 美 丑 妍 媒 、 各 具 形 态 , 如 今 却 
都 尽 人 正规 矩阵 之 殴 矣 1 
定理 4. 1.4 与 正规 矩阵 西 相似 的 方 阵 仍然 是 正规 矩阵 . 
证 明 : 如 果 存 在 本 矩阵 避 , 使 得 B 二 Um"AU, 则 
BB5 一 (CUHAU) (UTAU)® = UAUUNANU = UHEAAHU 
= UAHAU = UHAHAU 
= UANUUYAU = (UNAU)N (UNAU) = BB 
证 毕 . 
定理 4.1.5 方 阵 4 是 正规 的 , 当 且 仅 当 4 与 对 角 和 矩阵 A 西 相 似 , 并 且 对 角 和 矩阵 人 
的 对 角 元 就 是 正规 矩阵 4 的 特征 值 , 西 相似 矩阵 U 的 各 列 就 是 相应 的 特征 向 量 . 
证 明 : 必 要 性 . 如 果 4 是 正规 矩阵 ,那么 4 存在 谱 分 解 4 王 UAU- = 二 UAU", 即 AU 二 
UA. 设 U= (at) ,人 一 diagy wh)， 则 
Al(ui yt 一 (4 AAA ) 一 Mu 2 AL 


显然 An; AiU;. 
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充分 性 . 若 4 与 对 角 和 矩阵 A 西 相似 , 即 U AU 二 A, 显然 可 验证 4m"A 二 A4" 成 立 . 证 毕 . 

我 们 知道 , 实 对 称 和 矩阵 拥有 完备 正 交 系 , 即 ”个 两 两 正 交 的 单位 特征 向 量 . 定理 4. 1.5 
则 指出 了 在 更 一 般 的 正规 矩阵 中 ,这 个 性 质 得 以 保留 . 

定理 4.1.6 方 阵 A 是 正规 的 , 当 且 仅 当 4 有 完备 正 交 系 . 

结合 定理 4. 1. 5 和 定理 4. 1. 6, 设 正规 矩阵 4 的 谱 分 解 为 4 = 二 UAUT' 二 UAUY, 并 令 
了 二 (yt ) A=diag Ni ,A hi) ,GS=uur (一 1,2,……,72), 则 


Al ul 
A= (ui ,us ,UU,) 


Nae) ns 


= A Aw A = iG 二 Gs 十 … 十 AG， C1. 8Y 
如 果 在 复 和 矩阵 空间 C” 中 引入 内 积 (4,B) = tr(BNA), 则 当 i 关 /时 ,有 


(Gi;,G;) Ss tr (GHG.,) 3 tr (wu uu ) 三 0 
(G;,G;) = tr(GHG,) = tr(ualuaud) = tr(uu!t) = tr(utiu,)= 1 


这 里 的 G1 ,Gs，…,G, 显然 是 一 组 标准 正 交 基 ( 对 应 的 空间 是 什么 ?) ,因此 式 (4. 1. 8) 
也 被 称 为 正规 矩阵 4 的 谱 分 解 表达 式 . 
思考 : 谱 分 解 表达 式 意义 何在 ? 


1 = 
例 4.1.2 已 知 正规 箱 阵 A = (” ”，), 求 4 的 谱 分 解 表达 式 . 
解 : 易 知 4 的 特征 值 为 41.2 一 1 二 之 
= 一 由 J = 
当 和 一 1 十 i 时 ,由 4 一 1 二 (一,)~(。 。 ) 可 知 对 应 Xi 的 单位 特征 向 量 


1 0 
为 一 ( 房 ' 站 );: 当 =1 一 i 时 ,由 4 一 1 一 ( ,)~( ) 可 知 对 应 2 的 音 
们 特征 向 量 为 ww 一 ( 启 ,* 记 ) , 因此 所 求 为 可 = (u ,ww) 一 去 ，)， 此 时 对 角 短 阵 为 
Li 0 
| 0 1 


显然 可 知 G 一 去 (_， 1),G; = 十 (。 ，'), 因此 和 4 的 谱 分 解 表达 式 为 


2 


1 


1 琶 1 1 
下 引 一 让 
一 是 下 


= 一 更 
] - AG) 十 2C2 


Matlab 中 提供 了 内 置 函 数 schur, 用 于 计算 矩阵 4 的 Schur 分 解 ,其 调用 格式 为 
[U,T]= schur (A) 


当 4 是 实 和 矩阵 时 ,调用 格式 必须 修改 为 
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[UVU,T]= schur (A, 'complex') 


例 4.1.3 设 4 为 正规 矩阵 ,上 且 4 一 4 全 , 则 4 一 人 4. 
证 明 : 因 为 4 是 正规 矩阵 ,所 以 有 谱 分 解 人 = UAU", 因此 
4 一 (UAUH) = (UAU™) UAUY) UAUY) = UASUY ,42 一 UA2UB 

注意 到 A 二, 故 UA5U" 二 UA?U"' ,这样 A == A, 也 就 是 避 三 对， 解 得 人 一 0 
或 1, 从 而 A? == A ,进而 可 知 4? 一 UA?Ur 一 UAUE = A. 证 毕 . 

例 4.1.4 设 A4,B 均 为 n 阶 正规 矩阵 , 且 4B 二 BA, 则 AB 与 BA 均 是 正规 矩阵 . 

证 明 : 设 Ax 二 Ax, 其 中 x 为 单位 向 量 , 则 BAx 一 ABx 二 XBx, 即 Bx 也 是 A 的 属于 特 
征 值 4 的 特征 向 量 ,从 而 存在 j, 使 得 Bx = yx, 即 x 也 是 B 的 属于 特征 值 j 的 特征 向 量 . 

下 证 可 交换 矩阵 4, 了 可 同时 下 上 三 角 化 , 即 若 4B 二 B4, 则 存在 酉 矩阵 W, 使 得 
WAW 和 W"BW 均 为 上 三 角 和 矩阵 . 我 们 对 n 采用 归纳 法 . 显然 == 1 时 结论 成 立 . 

根据 Schur 引 理 ,将 x 扩充 为 西 矩 阵 U 二 (x,us,…,u)，, 使 得 


4 Xx 


4 
UAU = | ,UNBU 一 


Bi 


Al 


由 4B 二 BA 可 知 (UNAU) (UYBU) 二 (UFBU) (UNAU), 从 而 Ai Bi == BiA1. 由 归纳 
假设 可 知 ,存在 ”一 1 阶 本 矩阵 WW 和 上 三 角 和 矩阵 了 TT, 使 得 VHBVi 二 Ti. 令 V= diag(l， 
Vi be WwW = UVY ， 则 
1 


4xk Xx 4k Xx 


一 T 


WiBW = Vi (UBU)VY = 
7 


VT 
即 工 三 WIBW 为 上 三 角 和 矩阵 ,并 且 W 是 一 个 西 和 矩阵 . 同 理 可 知 , R 二 WiAW 也 是 上 三 角 
矩阵 . 

由 于 4 二 WRW™, 因此 At4 一 WRNMR) Wi, 448 一 W(RR"N) WH. 注意 到 AHA 一 
AA", 故 可 得 RIR 二 RRY, 从 而 由 引 理 4.1.1 可 知 R 是 对 角 和 矩阵 . 同 理 可 证 , T 也 是 对 角 
矩阵 . 这 就 是 说 ,可 交换 的 正规 矩阵 A、B 可 同时 西 对 角 化 , 即 存在 酉 和 矩阵 W, 使 得 R = 
WriAW 和 T= 二 WHBW 均 为 对 角 和 矩阵 . 

由 于 A、B 可 同时 西 对 角 化 ,因此 WABW = 二 (WHAW) (WHBW) = RT, 即 和 矩阵 4B 有 
完备 正 交 系 ,此 即 4B 是 正规 矩阵 . 同样 地 ,由 于 WiiBAW = 二 (WHBW) (WHAW) 二 TR, 故 
BA 也 是 正规 和 矩阵. 证 毕 . 

例 4.1.5 对 于 Sylvester 方程 

4 一 XB 一 C 
其 中 ,4,B,XE R”, 定义 Sylvester 变换 
S :XHSCX) = AX— XB 


如 果 和 矩阵 4.B 没有 公共 特征 值 ,那么 变换 S 是 可 逆 的 . 
证 明 : 先 将 Sylvester 方程 变 成 简单 形式 . 


B Vi 


第 4 章 ， 特殊 变换 及 其 矩阵 。 167 。 


考虑 BB 的 schur 分解 B 二 VTV?, 从 而 Sylvester 方程 转化 为 
A(XV)— (XV)T= CV 
若 记 Y 二 XV,D 二 CV, 则 上 式 即 为 特殊 的 Sylvester 方程 
AY—YT=D 
设 Y 了 = Cysyyy 呈 ,814) ;DD 二 (di,d;,…,d,),T 二 (ty ) (注意 当 i 谊 j 时 二 二 0), 则 


ACyis yar sy ) — Ch ya yn) = (4.1.9) 


Lm 


因此 Ay' tyi = (A—tuD) yy1 一 d. 骨 于 ty 是 B 的 特征 值 ,所 以 它 不 是 A 的 特征 
值 . 于 是 A 一 1 可 道 , 即 y! 是 线性 方程 组 (4 一 WD yi 二 di 的 唯一 解 . 
接 下 来 ,考虑 系统 (4. 1.9) 第 二 列 的 情形 ,可 知 


Ay2 — ty2 = (A— tT) y= d; ts yi 


由 于 yi 已 确定 ,显然 方程 右 侧 唯一 确定 ,注意 到 tz; 仍 是 B 的 特征 值 ,所 以 它 不 是 A 
的 特征 值 , 因 此 此 时 4 一 妇 工 也 可 逆 , 即 ys 是 线性 方程 组 (A 一 to 了) 二 ds 十 tizyi 的 唯 
类 似 地 ,一 旦 我 们 确定 Wisy2r "sy (R=2,3,. ,7n ), 则 A—taI 也 可 逆 , 即 Dk 是 线 


kl 
性 方程 组 (4 一色 站 yi 二 di 十 》 ta y; 的 唯一 解 . 
i=1 


至 此 ,我 们 得 到 Sylvester 方程 的 唯一 解 Y, 从 而 和 二 YV? 是 SC(X) 二 CC 的 唯一 解 , 故 
Sylvester 变换 5 是 可 逆 的 ,也 就 是 Sylvester 方程 的 解 是 唯一 的 . 证 毕 . 
舒 尔 (Issai Schur, 见 图 4- 1) 是 德国 著名 的 犹太 数学 家 ， 
其 研究 涉及 群 论 .矩阵 论 .代数 方程 .数论 .积分 方程 和 函数 论 
等 领域 . 在 弗 罗 贝 尼 乌 斯 的 指导 下 ,他 于 1901 年 获得 柏林 大 
学 的 博士 学 位 ,博士 论文 研究 的 是 复数 域 上 一 般 线性 群 的 有 
理 表示 ,其 中 引入 的 函数 如 今 被 称 为 Schur 函数 . 1904 一 1907 
年 间 ,他 研究 了 和 群 的 投影 表示 和 和 群 的 特征 标 , 并 提出 了 著名 的 
Schur 引 理 . 在 矩阵 分 析 中 ,Schur 引 理 是 基础 性 的 结论 ,而 在 
矩阵 计算 中 ,Schur 分 解 也 受到 越 来 越 多 的 关注 . 另外 本 书 第 
| 一 章 提 及 的 Schur 补 也 是 舒 尔 得 到 的 成 果 . 1916 年 起 ,他 通过 
图 4-1 和 舒 尔 (1875 一 1941) 演讲 和 合作 研究 ,在 柏林 大 学 开创 了 群 的 表示 论 学 派 ,聚集 了 
一 大 批 青 年 才 俊 . 1922 年 他 光荣 地 入 选 普鲁士 科学 研究 院 . 
随 着 纳粹 的 出 现 , 作 为 犹太 人 的 舒 尔 ,生活 日 渐 艰 难 . 尽管 舒 尔 将 自己 当 作 德 国人 ， 
并 因此 拒绝 了 移民 美国 和 英国 的 邀请 ,但 他 还 是 在 1933 年 被 勒令 “退休 ”, 这 个 决定 遭 到 
了 学 生 和 教授 们 的 公开 抗议 ,因为 舒 尔 次 受 他 们 的 尊敬 和 喜爱 . 两 年 后 , 舒 尔 被 正式 解除 
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了 教授 职务 .到 1938 年 ,由 于 他 曾经 的 同事 .纳粹 分 子 比 伯 巴 赫 (Ludwig Bieberbach， 
1886 一 1982 ,以 比 伯 巴 赫 猜 想 而 闻名 ) 在 他 的 签名 后 写 下 的 "犹太 人 到 现在 居然 还 是 科学 
委员 会 的 成 员 , 这 让 我 很 吃惊 ”, 他 很 快 被 解除 了 普鲁士 科学 研究 院 的 一 切 职 务 . 难以 理 
解 作 为 德国 人 的 他 在 德国 却 不 受 欢迎 ,他 身心 俱 疲 , 次 年 迁居 特拉维夫 . 因为 缺乏 生活 来 
源 , 他 的 生活 极端 贫困 ,甚至 到 了 被 迫 出 售 他 心爱 的 学 术 书 籍 的 地 步 . 66 岁 生日 那天 ,他 
静 静 地 离开 了 了 人世. 


4 2 _Hermite 变换 与 Hermite 答 阵 | 


二 ner I 


单 从 变换 的 角度 ,我 们 很 难 把 Hermite 变换 (对 称 变换 ) 与 正规 变换 联系 起 来 ,但 矩 
阵 即 变换 ,从 Hermite 矩阵 (对 称 和 矩阵 ) 的 定义 ,或 者 从 Hermite 矩阵 (对 称 和 矩阵 ) 都 可 对 
角 化 上 却 能 找到 两 者 的 关联 ,这 似乎 可 以 作为 数学 的 “奇异 美 ” 的 一 个 例证 . 

4. 2.1 Hermite 变换 (Hermite 矩阵) 的 定义 和 性 质 

我 们 知道 , 实 对 称 和 矩阵 A 满足 关系 式 A" 二 A, 推广 到 西 空间 C”, 相应 的 矩阵 A 称 
为 Hermite 矩阵 , 它 满足 关系 式 An 二 4, 既然 矩阵 即 变换 ,那么 Hermite 矩阵 以 及 实 对 
称 和 矩阵 与 什么 样 的 变换 对 应 呢 ? 

设 厂 在 本 空间 YV 的 一 组 标准 正 交 基 sl ,se ,…,s, 下 的 矩阵 为 4, 日 A 二 A. 任 取 w， 
1EV, 令 wx 一 (ss 2 有 一 (zs Ey, 


Ta) = (8 88)4r,T( 有 一 (es Ay 
显然 要 考虑 内 积 (To) ,有 和 (ox, (7 (08)) 这样 才 有 可 能 出 现 等 式 . 事实 上 ,由 如 一 4 可 知 
(TP = yAr = (yA Dx = (Ay x= (oa, (TA) 
定义 4.2.1 设 工 是 西 空间 V 上 的 线性 变换 ,如 果 对 任意 a,B E V, 都 有 
(Tl(a) ,Pp) = (a, TP)) (4. 2. 1) 


则 称 工 为 VY 上 的 Hermite 变换 (Hermite transformation) 或 自 伴 变换 (self-adjoint trans- 
formation)， 并 称 厂 在 V 的 任意 一 组 标准 正 交 基 下 的 矩阵 为 Hermite 矩阵 (Hermite matrix). 
定义 4.2.2 设 厂 是 欧 氏 空间 VW 上 的 线性 变换 ,如 果 对 任意 a,B E V, 都 有 


(T (0) ,及 = (a, TP) (4. 22) 


则 称 工 为 VY 上 的 对 称 变换 (symmetric transformation) ,并 称 本 在 V 的 任意 一 组 标准 正 交 
基 下 的 和 矩阵 为 对 称 和 矩阵 (symmetric matrix). 

定理 4.2.1 本 空间 (或 欧 氏 空间 ) Y 上 的 线性 变换 7 是 Hermite 变换 (对 称 变换 ) 
的 充 要 条 件 是 芽 在 V 的 任意 一 组 标准 正 交 基 下 的 和 矩阵 A 满足 A = A(47 一 4). 

证 明 : 充 分 性 的 证 明 前 已 给 出 ,下 证 必要 性 . 

设 芽 在 V 的 一 组 标准 正 交 基 g1 ,gs ,…,s, 下 的 矩阵 为 4 二 (aj ). 由 于 


(T (gi) ,8;) = (dwe1T avE2 tT avg sg)) = ai (Tg;) ,8) 一 ai 
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所 以 a; = (Ts),s) = (8;,T(8))) = (JT(e)) v8) 一 ,从 而 4 == A. 证 毕 . 

例 4.2.1  ( 方 阵 的 Cartesian 分 解 ) 任 意 复方 阵 4 可 分 解 为 4 = Hi 十 ?五 ,其 中 
Hi .H; 都 是 Hermite 窍 阵 ， 

显然 i 瑟 ; 满足 人 G 百 ,)8a 一 一 iH3 一 一 iHs, 即 iH; 是 反 Hermite 矩阵 ,因此 Cartesian 
分 解说 的 是 任意 复 和 矩阵 可 分 解 为 一 个 Hermite 矩阵 与 一 个 反 Hermite 矩阵 之 和 . 与 之 对 
应 的 , 则 是 任意 实 矩 阵 可 分 解 为 一 个 对 称 和 矩阵 与 一 个 反对 称 矩 阵 之 和 . 再 特殊 到 实 函 数 ， 
就 是 任意 实 函 数 可 分 解 为 一 个 奇 函 数 与 一 个 偶 函 数 之 和 . 

定义 4.2.3 设 了 是 本 空间 Y 上 的 线性 变换 ,如 果 对 任意 w, EV, 都 有 

(7 (ax),1) =— (ga,T (Pp)) (4.2.39 


则 称 克 为 V 上 的 反 Hermite 变换 (anti-Hermitian transformation ) 或 斜 Hermite 变换 
(skew-Hermitian transformation) 或 斜 自 伴 变换 (skew self-adjoint transformation) ,并 称 
廿 在 V 的 任意 一 组 标准 正 交 基 下 的 矩阵 为 反 Hermite 和 矩阵 (anti-Hermitian matrix) 或 斜 
Hermite 和 矩阵 (skew-Hermitian matrix)， 


定义 4.2.4 设 7 是 欧 氏 空间 Y 上 的 线性 变换 ,如 果 对 任意 @,B EV, 都 有 
(To) ,有 =— (a,T (Pp)) (4. 2. 4) 


则 称 工 为 VY 上 的 反对 称 变换 (anti-symmetric transformation), 并 称 厂 在 V 的 任意 一 组 
标准 正 交 基 下 的 矩阵 为 反对 称 和 矩阵 (anti-symmetric matrix). 

类 似 Hermite 变换 (对 称 变换 ) 的 情形 ,可 以 证 明 下 面 的 定理 : 

定理 4. 2.2 西 空间 (或 欧 氏 空间 )V 上 的 线性 变换 7 是 反 Hermite 变换 (反对 称 变 
换 ) 的 充 要 条 件 是 芽 在 V 的 任意 一 组 标准 正 交 基 下 的 矩阵 A 满足 At = 一 A(4' 一 一 A). 

作为 特殊 的 正规 矩阵 , Hermite 矩阵 自然 具有 正规 矩阵 的 一 些 性 质 . 同时 ,作为 实 对 
称 矩 阵 的 类 似 物 , Hermite 矩阵 也 同样 具有 许多 和 实 对 称 矩 阵 类 似 的 性 质 . 

定理 4.2.3 正规 矩阵 4 是 Hermite 矩阵 的 充 要 条 件 是 4 的 特征 值 全 是 实数 , 即 A 
西 相 似 于 实 对 角 和 矩 阵 . 

证 明 : 充 分 性 . 因为 A 是 正规 矩阵 , 故 有 谱 分 解 4 = UAU"™, 这 里 A 的 对 角 元 是 A 
的 特征 值 . 由 于 4 的 特征 值 全 是 实数 ,所 以 A = A, 从 而 4 = 二 (UAUH)8 = UAUH = 
UAU" = A. 

必要 性 . 因为 4 二 =A", 又 A 二 UAU", 所 以 UAU"T 二 (OAUED ==UAU, 从 而 A = 
4, 即 A 的 对 角 元 全 是 实数 . 证 毕 . 

由 此 定理 易 知 ,Hermite 和 矩阵 4 具有 与 正规 矩阵 类 似 的 谱 分 解 

4 = UAI = UAU" (4. 2. 5) 


只 是 其 中 的 矩阵 4 是 实 对 角 和 矩阵 而 已 . 同样 地 , Hermite 矩阵 4 也 具有 谱 分 解 表 达 式 
(4. 1.7), 只 是 其 中 的 特征 值 ,X42，,… 都 是 实数 . 

对 于 反 Hermite 矩阵 ,显然 存在 类 似 结果 ， 

定理 4.2.4 正规 矩阵 4 是 反 Hermite 矩阵 的 充 要 条 件 是 4 的 特征 值 全 是 纯 虚 数 ， 
即 4 西 相似 于 对 角 元 为 纯 虚 数 的 对 角 和 矩阵 . 

由 定理 4. 2.3 可 知 , 当 Hermite 矩阵 特殊 为 实 对 称 矩 阵 时 , 实 对 称 矩 阵 的 特征 值 也 
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全 是 实数 . 结合 线性 代数 知识 ,我 们 知道 此 时 本 相似 已 特殊 为 正 交 相似 ,本 相似 矩阵 已 特 
殊 为 正 交 相似 矩阵 , 即 实 对 称 和 矩阵 的 特征 向 量 全 部 为 实 特征 向 量 . 这 是 实 对 称 和 矩阵 与 
Hermite 矩阵 的 一 个 重大 区 别 . 

定理 4.2.5 实 对 称 和 矩阵 4 正 交 相似 于 实 对 角 矩 阵 4, 这 里 A 的 对 角 元 是 4 的 特征 
值 , 正 交 相似 矩阵 8 的 列 向 量 是 相应 的 单位 特征 向 量 . 

证 明 : 类 似 于 Schur 引 理 的 证 明 , 对 和 矩阵 4 的 阶 数 n 做 归纳 法 . 

当 n 二 1 时 定理 显然 成 立 . 设 当 二 一 1 时 定理 成 立 , 考 虑 当 n 二 时 的 情形 . 

设 ) 为 & 阶 矩阵 A 的 一 个 特征 值 . 显然 入 是 实数 . 由 于 4 一 NI 是 实 矩阵 上 且 | A 一 和 IT| = 二 
0, 因此 线性 方程 组 (4 一 MDx 王 0 有 非 零 解 ,而且 qi 是 单位 列 向 量 . 显然 Agi 二 gi. 
将 qi 扩充 成 RR“ 的 一 组 标准 正 交 基 qi 412，""", qk， 令 0， 二 (qi1,q:，"…,4i), 显然 Q1 是 上 阶 
正 交 和 矩阵 ,并 且 


40， (Agqi ,Aqg;» 49) (Cigl ,49， ，*** ,Aqg.) 


k 
由 于 qd1 4d2，""*"» Gs 是 R* 的 一 组 标准 正 交 基 , 所 以 Ag; = vay qj; (1 = 2353,°,k ). 
j=1 
因此 


Al a 
AQ!1 = (qi,q2,""*,q;) 
Al 
工 Al 人 
此 即 Q1AQO1 二 0 A ,其 中 wx 一 (aa ;aa yaa )， Al 二 (ay) (sst 二 2,3,"…',k ) 为 
1 
k 一 1 阶 实 和 矩阵 .由 于 4 二 A'，, 因此 
A CC | _ A 0 
= QiAQ' = Q! A'Q' = (01AQ1)' = 
0 A CI 4 


这 说 明 @!' 二 0, 且 hf = Ai, 即 07TAQ1 也 是 实 对 称 和 矩阵 . 

由 于 4; 是 & 一 1 阶 实 对 称 和 矩阵 ,根据 归纳 假设 ,存在 & 一 1 阶 正 交 和 矩阵 0 和 一 1 阶 
对 角 和 矩阵 Ai, 使 得 0,7A10, = Ai. 令 0 = diag(1,0;), 0 二 0;0,; 易 证 0 是 阶 正 交 
和 矩阵 ,从 而 


Al Al 

CQ 40=00400 = QQ!Q = | 0; 
Al Al 
] Ai 1 A Ai 
一 司 | = |= 三 A 证 毕 . 
Qs Al 0 QA0O; 人 
由 此 定理 易 知 , 实 对 称 和 矩阵 4 的 特征 值 分 解 或 谱 分 解 为 
4 一 CQC4O -一 CO40 (4. 2.6) 


令 正 交 和 矩阵 0 | (qi 42 sO) 实 对 角 和 矩阵 人 二 diag (A »A2 yn)y 则 式 (4. 2. 6) 
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可 改写 为 
A=NAuqgigi 二 A2q29!l 十 … 十 A1q,q) (4. 2.7) 


此 即 实 对 称 矩 阵 4 的 特征 值 分 解 表 达 式 或 谱 分 解 表达 式 . 

对 于 反对 称 和 矩阵 , 却 不 完全 有 类 似 结果 . 

定理 4.2.6 反对 称 和 矩阵 的 特征 值 全 是 纯 虚 数 . 

但 是 在 正 交 相似 下 ,反对 称 和 矩阵 的 标准 型 却 未必 是 对 角 和 矩 阵 . 详 见 4. 6. 1 小 节 . 

例 4.2.2 (Cayley 变换 ) 知 实 方 阵 A 是 反对 称 和 矩阵 ,那么 I 士 4 是 非 奇 异 的 ,并 且 
Cayley 变换 矩阵 S$ 二 (I 一 A) (十 4) 是 正 交 和 矩阵 . 

证 明 : 对 任意 的 x € R”, 由 于 二 次 型 CA4x 为 实数 ,并 注意 到 47 二 一 A, 故 可 得 

x'Ax = (xI4x)T 一 XIAITX 一 一 XITAx 

此 即 xI4x 一 0 

对 于 方程 组 (IT 士 4)x 一 0, 由 于 x'x 二 x'(I 士 A)x 二 0, 因此 x 二 0, 即 方程 组 只 有 
零 解 ,从 而 I 土 4 是 非 奇 异 的 . 

由 于 (I 十 A)(I 一 A) 二 (I 一 A)(I 十 A), 所 以 $= (I 一 A) (I 十 A)71 = (I 十 A)” 
(I 一 A), 从 而 


S'=[(I+A) (I—A)]’ = (I—A') (I+A)T 
一 (十 4) [L(A4)T] = (I 十 4) (一 全) 


由 此 显然 可 推出 S$” 一 工 证 毕 . 
4.2.2 达到 教育 的 目的 是 用 头脑 ,又 不 是 用 脚 


埃 尔 米 特 (Charles Hermite, 见 图 4-2) 是 19 世纪 最 
伟大 的 代数 几何 学 家 ,研究 领域 涉及 数论 .二 次 型 .不 变量 
理论 \ 正 交 多 项 式 、 椭 圆 函 数 等 许多 领域 , Hermite 矩阵 、 
Hermite 标准 型 (即行 阶梯 矩阵 Ha )、Hermite 插值 、 
Hermite 多 项 式 、Hermite 算 子 、 三 次 Hermite 样 条 曲 
线 …… 数 学 中 有 很 多 以 他 的 名 字 命 名 的 东西 . 他 在 巴黎 高 
师 和 巴黎 大 学 执教 的 20 余年 里 ,训练 了 整整 一 代 卓 越 的 
法 国 数学 家 ,包括 博 雷 尔 (Emile Borel,1871 一 1956 ,测度 
论 的 创始 人 之 一 ,在 数学 分 析 中 贡献 了 有 限 覆 盖 定 理 ) 、 达 
布 (Jean-Gaston Darboux, 1842 一 1917, 发 展 了 微分 几何 
中 的 活动 标 架 法 ,贡献 了 数学 分 析 中 的 达 布 定理 、 达 布 积 
分 等 结论 ), 当然 ,他 最 著名 的 学 生 是 庞 加 莱 (Henri 
Foincare,1854 一 1912,19 世纪 后 四 分 之 一 和 20 世纪 初 的 
领袖 数学 家 ,相对 论 的 先驱 ,创立 代数 拓扑 学 ,以 庞 加 莱 猜 想 而 闻名 ). 

如 此 数学 天 才 , 可 是 数学 考试 却 是 他 一 生 的 恶 梦 . 老师 惩罚 他 ,用 木 条 打 他 的 脚 ( 他 
天 生 跋 脚 , 需 借 力 于 拐杖 ), 他 恨 死 了 ,后 来 写 道 :“ 达 到 教育 的 目的 是 用 头脑 ， 又 不 是 用 


图 4-2 埃 尔 米 特 (1822 一 1901) 
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脚 . 打脚 有 什么 用 ? 打脚 可 以 使 人 头脑 更 聪明 吗 ?” 他 的 数学 特别 好 ,是 因为 他 花 了 许多 
”时 间 去 看 牛顿 .高 斯 等 数学 大 师 的 原著 . 他 认为 只 有 在 那里 才能 找到 “数学 的 美 ,是 回 到 
基本 点 的 辩论 ,那里 才能 饮 到 数学 兴奋 的 源头 ”后 来 他 转 人 了 伽 罗 瓦 的 母校 ,并 且 数 学 
老师 都 是 理 查 德 (Louis Richard). 好 心 的 理 查 德 老师 15 年 前 没 能 拯救 天 才 伽 罗 瓦 ,如 今 
遇 到 这 位 “年 轻 的 拉 格 朗 日 ", 自 然 极 力 鼓励 . 因此 尽管 大 学 入 学 考试 埃 尔 米 特 重 考 了 五 
次 , 屡 败 屡 战 ,但 他 最 终 还 是 进入 了 巴黎 综合 理工 学 院 , 即 X. 可 是 一 年 后 (1843 年 ) 却 因 
他 的 跋 脚 被 校方 退学 . 好 在 他 结识 了 刘 维 尔 (Joseph Liouville,1809 一 1882 ,贡献 了 复 变 
函数 中 的 刘 维 尔 定理 等 结论 ,创办 了 《纯粹 与 应 用 数学 杂志 》, 并 于 1846 年 发 表 了 伽 罗 瓦 
的 部 分 遗 稿 ) ,并 经 刘 维 尔 推荐 与 雅 可 比 ( 详 见 6. 6. 5 小 节 ) 通 信 . 1848 年 起 ,他 被 任命 为 
X 的 助教 和 招生 考官 (估计 是 许多 伯乐 们 努力 的 结果 ). 1856 年 ,他 人 选 法 国 科 学 院 院 士 ， 
六 年 后 被 X 提升 为 为 他 而 特 设 的 讲师 . 1869 年 起 ,他 担任 XX 和 巴黎 大 学 的 教授 . 

埃 尔 米 特 在 不 变量 方面 有 较 多 成 果 , 以 致 于 西 尔 维 斯 特 曾 指出 ,“ 凯 芋 、 埃 尔 米 特 和 
我 组 成 了 一 个 不 变量 的 三 位 一 体 ”. 他 深入 研究 了 Hermite 二 次 型 ,并 于 1855 年 创立 了 
Hermite 变换 理论 ,这 是 关于 对 称 的 理论 . 或 许 我 们 可 以 说 , 正 因为 自己 的 “不 对 称 ”, 埃 尔 
米 特 才能 深刻 地 理解 并 驯服 对 称 之 美 . 


4.2.3 正定 Hermite 矩阵 


在 线性 代数 中 , 实 对 称 和 矩阵 常 与 实 二 次 型 紧密 联系 在 一 起 . 下 面 我 们 先 将 实 二 次 型 
推广 到 复 二 次 型 , 即 Hermite 二 次 型 . 

定义 4.2.5 称 ? 个 复 变 量 zz zu 和 它们 的 共 恩 变量 去 ,zo,… ,zi 之 间 的 复 
系数 二 次 齐 次 复 多 项 式 


fx Ym = 人 了 i Ee Uji (4. 2 8) 


1 一 1 )=] 
为 Hermite 二 次 型 (Hermite quadratic form) 或 复 二 次 型 (complex quadratic form) , 记 为 
f(x) = x Ax (4. 2. 9) 


这 里 x 二 (zi,… ,za)" ,并 且 称 矩阵 A = (ai) 为 此 二 次 型 的 矩阵 . 
由 定义 显然 可 知 和 矩阵 4 是 Hermite 矩阵 . 一 个 Hermite 矩阵 与 一 个 Hermite 二 次 型 
对 应 ,正如 一 个 实 对 称 和 矩阵 与 一 个 实 二 次 型 对 应 . 实 二 次 型 可 通过 正 交 变 换 化 成 标准 型 ， 
Hermite 二 次 型 也 具有 类 似 的 性 质 . 
定理 4.2.7 对 于 Hermite 二 次 型 f(x) 二 zh4x , 存在 西 变换 x = Uy，, 可 将 之 化 为 
标准 形 
二 二 人 (4. 2. 10) 


其 中 yy 二 yi, ,YW)1, 且 实数 4; 是 Hermite 矩阵 4 的 特征 值 . 
证 明 : 此 定理 显然 是 用 Hermite 二 次 型 语言 叙述 了 谱 分 解 表达 式 (4. 2. 5). 证 毕 ， 
定理 4. 2.8 (惯性 定理 ) 对 于 Hermite 二 次 型 f(x) = xna4x, 存在 可 道 的 线性 变换 
x 二 Py, 可 将 之 化 成 规范 形 


FXY 一 yY1Y1 上 F… 4 Vpyp Vatl Vsti 一 (4 2. 119 
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其 中 二 是 矩阵 4 的 秩 , 且 p 由 A 唯一 确定 . 

证 明 : 略 . 

我 们 分 别称 式 (4. 2. 11) 中 的 正 项 个 数 p 和 负 项 个 数 r 一 p 为 Hermite 二 次 型 的 正 惯 
性 指数 (positive index of inertia) 和 负 惯 性 指数 (negative index of inertia). 

因为 正 惯性 指数 p 与 秩 r 之 间 满 足 0 过 Pp 过 7 过 nn, 所 以 Hermite 二 次 型 可 分 为 五 种 
情况 : 

(1) 当 p= 二 =r 二 n 时 ,规范 形 为 f(x) =—x"Ax= yy = | yi| ,显然 当 x 天 0 时 y 去 0， 
故 x"Ax 二 0; 

(2) 当 p 二 r=<n 时 ,规范 形 为 f(x) 二 x"Ax 一 | yi;|?, 故 对 任意 xE C”, 有 xrAx 宇 0; 


(3) 当 p==0 且 7=n 时 ,规范 形 为 F(R) = Ax= 一 > | yi| ,显然 当 x 关 0 时 y 天 0, 故 
xiAx<=0; 

(4) 当 pp 二 0 且 rr<n 时 ,规范 形 为 A 一 四 | 六 ,显然 对 任意 YE C", 都 
有 xH4Ax<<0; 

(5) 当 0<p<r<n 时 ,规范 形 为 f(x) =x"Ax= 光 |y:|? - | 六 | 上, 对 不 同 的 xE 
C",xz4x 的 取 值 可 以 大 于 0、 小 于 0 或 等 于 0. 

根据 上 面 的 讨论 ,我 们 可 将 Hermite 二 次 型 分 类 如 下 : 

定义 4.2.6 设 有 Hermite 二 次 型 f(x) 一 x!iAx. 

(1) 如 果 对 任意 0 关 x EE C", 恒 有 x'Ax 之 0; 当 且 仅 当 x 二 0 时 xHiAx = 二 0, 则 称 
Hermite 二 次 型 xa4x 为 正定 的 (positive definite) ,对 应 的 矩阵 A 称 为 正定 Hermite 和 矩 
阵 , 记 为 4 二 0; 

(2) 如 果 对 任意 x € C", 恒 有 x*Ax 三 0, 则 称 Hermite 二 次 型 xiAx 为 半 正 定 的 
(semi-positive definite) ,对 应 的 矩阵 4 称 为 半 正 定 Hermite 矩阵 , 记 为 4 三 0; 

(3) 如 果 对 任意 0 和 关 xE C", 恒 有 xrAx 二 0; 当 且 仅 当 x = 二 0 时 xriAx 一 0, 则 称 
Hermite 二 次 型 xnAx 为 负 定 的 (negative definite) ,对 应 的 矩阵 A 称 为 负 定 Hermite 矩 
阵 , 记 为 A 二 0; 

(4) 如 果 对 任意 x € C", 恒 有 xrAx 去 0, 则 称 Hermite 二 次 型 xa4x 为 半 负 定 的 
(semi-negative definite) ,对 应 的 矩阵 A 称 为 半 负 定 Hermite 矩阵 , 记 为 4 去 0; 

(5) 如 果 对 不 同 的 x EC",x24x 有 时 为 正 , 有 时 为 负 , 有 时 又 为 0, 则 称 Hermite 二 
次 型 x"Ax 为 不 定 的 (undefinite) ,对 应 的 矩阵 4 称 为 不 定 Hermite 和 矩阵 . 

对 于 实 二 次 型 ,类 似 的 分 类 如 下 : 

定义 4.2.7 设 有 实 二 次 型 /(x) 一 x'Ax. 

(1) 如 果 对 任意 0 关 xXE R", 恒 有 x!'Ax 之 0; 当 且 仅 当 x 二 0 时 xTAx = 0, 则 称 实 
二 次 型 x Ax 为 正定 的 ,对 应 的 矩阵 4 称 为 正定 矩阵 , 记 为 4 之 0; 

《2) 如 果 对 任意 xE R", 恒 有 x'Ax 二 0, 则 称 实 二 次 型 xTr4x 为 半 正 定 的 ,对 应 的 矩 
阵 4 称 为 半 正 定 矩阵 , 记 为 4 三 0; 

(3) 如 果 对 任意 0 关 xE€ R", 恒 有 x'Ax 二 0; 当 且 仅 当 x 二 0 时 xTAx == 0, 则 称 实 
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二 次 型 YI4x 为 负 定 的 ,对 应 的 矩阵 A 称 为 负 定 和 矩阵 , 记 为 4 二 0; 

(4) 如 果 对 任意 xE R", 恒 有 x'Ax 牵 0, 则 称 实 二 次 型 xTAx 为 半 负 定 的 ,对 应 的 矩 
阵 4 称 为 半 负 定 矩 阵 , 记 为 4 入 0; 

(5) 如 果 对 不 同 的 x € R”", x Ax 有 时 为 正 , 有 时 为 负 , 有 时 又 为 0, 则 称 实 二 次 型 
xTA4x 为 不 定 的 ,对 应 的 矩阵 4 称 为 不 定 和 矩阵. 

和 拖 阵 即 变 换 , 那 么 上 述 矩 阵 对 应 什么 样 的 变换 呢 ? 考虑 到 Hermite 变换 要 考察 向 量 
的 像 与 原 像 的 内 积 , 而 正定 性 则 要 求 向 量 的 长 度 非 负 ,因此 我 们 要 考察 的 是 (w,T(o)) 
的 值 . 

定义 4.2.8 设 厂 是 本 空间 Y 上 的 Hermite 变换 ,如 果 对 任意 0 闫 a EV, 都 有 

(ga:'T(a)) >0 ((a,T (a)) > 0) 


则 称 了 为 本 空间 Y 上 的 正定 变换 ( 半 正 定 变换 ) , 记 作 克之 0( 克 三 0 ) ,并 称 克 在 Y 的 任 
意 一 组 标准 正 交 基 下 的 矩阵 4 为 正定 Hermite 矩阵 ( 半 正 定 Hermite 和 矩阵 )， 

对 6 和 关 wcEy, 设 wx 在 Y 的 一 组 标准 正 交 基 下 的 坐标 为 xz, 则 开 (@) 在 这 组 标准 正 交 
基 下 的 坐标 为 hx , 注意 到 定理 4. 2. 1 已 证 得 A 二 A, 从 而 


(ag,T (Co)) = (x,Ax) = (Ax) x 一 XUAHY 一 XHAx Cd 2 I2Y 


因此 定义 4. 2. 8 与 定义 4. 2.6 是 一 致 的 . 
定义 4.2.9 设 厂 是 欧 氏 空间 V 上 的 对 称 变换 ,如 果 对 任意 0 关 a EV, 都 有 


(a'T(a))>0 ((g,T(@)) 二 0) 


则 称 了 为 欧 氏 空间 V 上 的 正定 变换 ( 半 正 定 变换 ) , 记 作 万 之 0(T 厂 三 0 ) ,并 称 厂 在 V 的 
任意 一 组 标准 正 交 基 下 的 矩阵 为 正定 对 称 和 矩阵 ( 半 正 定 对 称 和 矩阵 ) . 

易 证 正定 ( 半 正 定 ) 和 矩阵 具有 下 列 性 质 . 

(1) 单 位 矩阵 工 > 0, 同时 也 有 了 宇 0 (这 显然 就 是 内 积 的 正 性 ); 

(2) 若 4 之 0 且 下 >0, 则 4 十 如 过 0 且 驳 二 0(k 为 任意 正 数 ); 

(3) 车 A 宇 0 有 是 B 宇 0,; 则 A 十 B 宇 0. 

正定 矩阵 还 具有 下 列 性 质 : 

定理 4.2.9 对 nn 阶 Hermite 矩阵 4, 下 列 命 题 是 等 价 的 : 

(1) A 是 正定 的 ; 

(2) 对 任意 阶 可 道 和 矩阵 P, PMAP 都 是 正定 Hermite 矩阵 ; 

(3) 4 的 nn 个 特征 值 全 是 正 数 ; 

(4) 存在 nn 阶 可 逆 和 矩阵 己 , 使 得 PNAP 一 厂 

(5) 存在 7” 阶 可 逆 和 矩阵 O, 使 得 A = CO80O; 

(6) 存在 nt 阶 可 逆 Hermite 矩阵 五 , 使 得 A = H. 

证 明 : 首 先 按 照 (1) 之 (2) 二 > (3) => (4) 全 (5) > (1) 的 路 线 来 证 明 . 

(1) 之 (2). 易 证 PYAP 是 Hermite 矩阵 . 记 y = 二 Px, 则 对 任意 0 关 x € C"， 可 知 
0 和 关 y € C", 再 由 (1) 可 得 (y,Ay) 盖 0, 此 时 (x,P"APx) = (Px,APx) = (y,Ay) 二 0， 
因此 由 式 (4. 2. 10) 可 知 PiAP 是 正定 Hermite 和 矩阵， 

(2) 全 (3). 由 Hermite 矩阵 4 的 谱 分 解 式 (4. 2.5) 可 得 UrAU 二 A = diagOi ,4 
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4). 注意 到 西 矩 阵 上 满足 (2) 中 了 的 要 求 , 故 可 知 A 是 正定 矩阵 , 即 对 任意 0 关 xE€ C”， 
有 (x,Ax) 二 0, 取 xx 一 e (j= 二 1,2,…,n ) 即 单位 和 矩阵 I 的 第 j 列 , 则 4 一 (ej ,Aej) 二 0， 
即 4 的 特征 值 全 为 正 数 . 

(3) 之 (4). 对 Hermite 矩阵 4, 有 UAU = A 二 diag(41h2 ,A). 由 于 和 ha，…， 
1 均 为 正 数 , 故 令 A 二 diag(1/ V ,LV Via 1/ Vi) 且 P 二 UA “*, 易 知 P 了 是 可 
逆 和 矩阵 ,从 而 


PHA4P Sa CA SINRURNAUA™ A Ee A ”AA™® 一 了 


(4) 全 (5). 由 (4) 知 存在 可 逆 和 矩阵 已, 使 得 PMAP 一 了 故 令 0 二 P71, 即 得 A = 010. 

(5) 之 (1). 因为 存在 可 逆 和 矩阵 Q, 使 得 4 = 0m"0, 因此 对 任意 0 关 xE€ C", 记 y= 
Qx, 显然 0 了 关 yE C”", 且 有 (x,Ax) 二 (x,QNQx) 二 (Qx,Qx) 二 (y,y) 二 0, 此 即 A 是 
正定 矩阵 . 

下 面 证 明 (1) 之 (6) 和 (6) 之 (1). 

(1) 之 (06). 因 为 4 是 正定 Hermite 矩阵 ,所 以 4 的 谱 分 解 为 4 一 UAUE, 其 中 A = 
diag(A1 ah) 的 对 角 元 全 为 正 数 . 邻 AY? = diag(V Vs ,VN ), 吾 一 DUAL2 UH， 
易 证 五 是 可 道 的 Hermite 矩阵 , 且 


A= UAU™ es UA'?IA2U™ 三 = (UAL12UH)CUAL2UE) = se 


(6) 过 (1). 因为 存在 可 逆 Hermite 矩阵 豆 , 使 得 4 二 HE = HNH, 因此 类 似 于 (5) 二 
(1) 即 知 A 是 正定 矩阵 . 证 毕 . 

对 于 半 正 定 和 矩阵 ,也 可 证 明 类 似 的 性 质 . 

定理 4.2. 10 对 nn 阶 Hermite 矩阵 4, 下 列 命题 是 等 价 的 

(1) 4 是 半 正 定 的 ; 

(2) 对 任意 交 阶 可 闭 和 矩阵 已, Pa4P 都 是 半 正 定 Hermite 和 矩阵; 

(3) 4 的 特征 值 全 是 非 负 实数 ; 

I, O 


(4) 存在 ” 阶 可 道 矩阵 P, 使得 P"AP = (0 


(5) 存在 秩 为 二 的 2 阶 矩阵 Q, 使 得 4 一 OO 

(6) 存在 nn 阶 Hermite 矩阵 五 , 使 得 A = 正 . 

例 4.2.3 对 nn 阶 Hermite 和 矩阵 4, 证 明 : 

(GD) 若 4 之 0 是 正定 的 , 则 4 之 0 且 |14|>0;(2) 若 4 是 半 正 定 的 , 则 |4 | 三 0. 

证 明 ;(1) 设 A 的 特征 值 为 hi,)z，…， 由 于 4 之 0, 由 定理 4. 2.9 可 知 1 ns，…,， 
均 为 正 数 , 因 此 X77 ,X21 ，,…,h! 也 均 为 正 数 ,再 由 定理 4. 2. 9 可 知 4 二 0, 且 14|== 
hp > 0. 

(2) 证 明 与 (1) 类 似 . 证 毕 . 

定理 4. 2. 11 ( 块 对 角 Hermite 矩阵 ) 对 Hermite 矩阵 4 € Ce 及 葡 a 和 
Co, 令 4=diag(4,4). 证 明 4 之 0 当 上 且 仅 当 4 之 0 且 4;, 二 0. 


)， 这 里 为 4 的 秩 ， 


证 明 : 若 4 > 之 0, 则 对 任意 0 关 yE Ce 令 x 一 js C", 显然 x 关 0, 因此 yn4iy 
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:一 XHAY 0, 即 Al p> 0., 同 理 可 证 4， 2 0. 

反之 ,对 任意 0 天 x 一 NE C"，, 由 4 二 0 且 4, 二 0 可 知 , yahiy 之 0 且 zahsz 之 0， 
而 且 ya4iy 与 zH42sz 不 同时 为 零 ( 否 则 y 王 0 且 z 王 0 从 而 x 一 0), 从 而 
Ai 


J 
= yH4iy 十 zajiz 之 0 
z 


xHAx = (yHzH) 


A 


此 即 4 之 0. 证 毕 . 
All Ai 
A ea A 
C**, 则 A 二 0 的 充 要 条 件 是 A >0 且 其 Schur 补 LA/4a] > 之 0, 这 里 [4/ An]= 
Azz 一 公信 Ai Al;. 

证 明 : 若 4 > 0, 类 似 于 定理 4.2.11, 易 知 Ai 二 0 且 .[A/ A1] 守 0. 

反之 , 当 Au 之 0 上 且 [L4A/4] 二 0 时 ,由 定理 4 2.11 可知 D= diag(hu,[A/ A11]) 守 0. 
又 由 第 1 章 的 式 (1. 2. 13) 可 知 


例 4.2.4 (Schur 补 ) 设 n 阶 Hermite 矩阵 4 被 分 块 为 4A 王 


A A 到 O | [A O I AnAi 
= G4.. 2 13) 
AS Ay A AN 了 O [A/ A] O 1 
于 站 说 准 1; 
记忆 一 由 | , 显然 忆 可 道 ,由 于 44) 二 AB (A471)" 一 4 CAR) 一 
nk 
I O 
ABAT (因为 4 之 0 ), 则 PH = [ee | ,An 二 (4 2. 13) 即 为 4= PHDP. 再 由 
12 11 mk 


定理 4. 2. 9 可知 4 之 0. 证 毕 . 

判定 实 正定 矩阵 的 Sylvester 定理 也 可 以 推广 到 正定 Hermite 和 矩阵. 

定理 4. 2. 12 (Sylvester 定理 ) n 阶 Hermite 矩阵 4 二 0 的 充 要 条 件 是 矩阵 和 4 的 
各 阶 顺 序 主子 式 皆 为 正 数 , 即 Di 0,D, 之 0,…,D, > 0. 这 里 


Ql Ci “QIA 


Up Qi ?am 


推论 nn 阶 Hermite 矩阵 4 一 0 的 充 要 条 件 是 (一 1)*D; = | 一 4 人 | 二 0( 一 1， 
2，……,7). 

式 (4. 2.13) 向 我 们 暗示 了 实 对 称 正 定 矩 阵 的 Cholesky 分 解 也 可 推广 到 正定 Hermite 
矩阵. 


定理 4. 2. 13 (Cholesky 分 解 定理 ) n 阶 Hermite 矩阵 4 之 0 的 充 要 条 件 是 存在 非 奇 
异 的 下 三 角 和 矩阵 工 使 得 


A=IL" (4. 2. 14) 
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我 们 称 式 (4. 2. 14) 为 正定 Hermite 矩阵 4 的 Cholesky 分 解 . 

证 明 :充分 性 由 定理 4. 2. 9 即 得 .下 证 必要 性 . 

由 定理 4. 2.9 可 知 A 二 00, 这 里 @ 为 可 逆 和 矩阵 .由 3.6 节 可 知 , 可 逆 的 复 和 矩阵 存在 
UR 分 解 . 设 矩 阵 Q@ 的 UR 分 解 为 8 = UHR, 这 里 Di 为 西 和 矩阵 , R 为 对 角 元 为 正 数 的 上 
三 角 德 阵 , 则 

久 王 OHO RHUNUER RHER 
今 工 二 Ri, 则 A 二 LLYN. 证 毕 . 
可 以 证 明 ,Cholesky 分 解 式 (4. 2. 14) 中 的 工 是 唯一 的 . 


4.2.4 对称 :是 可 怕 的 还 是 可 爱 的 ? 


提 到 对 称 , 人 们 可 能 更 多 地 联想 到 艺术 ,因此 对 称 性 常 与 平衡 .形状 形式、 空间 等 一 
同 被 讨论 . 尽管 从 静态 表现 上 理解 对 称 性 ,有 一 定 意义 ,但 更 重要 的 应 该 是 从 操作 意义 
上 、 从 生成 过 程 上 理解 对 称 性 . 

“可 怕 的 对 称 ” 是 徐 一 鸿 (Anthony Zee) 原 题 为 Fearful Symmetry 的 科普 书 的 译名 
译 成 “可 旦 的 对 称 ” 更 妥 , 这 在 清华 大 学 出 版 社 的 新 译本 中 得 以 更 正 . 在 该 书 中 , 徐 一 鸿 从 
美感 和 哲学 的 高 度 总 结 物理 学 ,把 当代 物理 学 总 结 为 对 称 性 和 最 小 作用 原理 . 事实 上 ,在 
物理 学 中 ,对称 性 是 指 某 种 操作 下 的 不 变性 或 者 守恒 性 , 常 与 守恒 定律 相 联系 . 比如 与 空 
间 平 移 不 变性 对 应 的 是 动量 守恒 定律 ,与 时 间 和 平移 不 变性 对 应 的 是 能 量 守恒 定律 , 与 旋 
转变 换 不 变性 对 应 的 是 角 动 量 守恒 ,与 空间 反射 (镜像 ) 操 作 不 变性 对 应 的 是 宇 称 守恒 . 
麦克 斯 韦 (James Clerk Maxwell,1831 一 1879 ,创立 了 经 典 电动 力学 和 光 的 电磁 说 ) 提 出 
的 方程 组 可 谓 对 称 性 在 物理 中 的 典型 应 用 . 当时 ,他 用 数学 方法 分 析 、 整 理 并 推广 了 法 拉 
第 (Michael Faraday,1791 一 1867 ,提出 了 电磁 感应 学 说 ) 的 思想 ,把 电磁 学 中 的 一 系列 基 
本 定律 表示 成 著名 的 麦克 斯 韦 方程 组 ， 


DivE = Q (4. 2. 15) 
Div 互 一 0 (4. 2. 16) 
1RoE =— 1 .2H (4. 2. 17) 
C ot 
Ret 彰 三 工 . 开 二 7 (4. 2. 18) 
大 ot en 


其 中 ,方程 (4. 2. 15) 相当 于 库仑 定律 ,表示 电场 强度 天 的 散 度 等 于 闭合 体内 所 含 总 电量 
Q; 方程 (4. 2. 16) 表示 磁场 强度 互 的 散 度 为 零 , 这 是 由 磁力 线 的 封闭 性 所 决定 的 ;方程 
(4. 2. 17) 表明 电场 强度 玉 的 旋 度 正比 于 磁场 强度 上方 对 时 间 z 的 变化 率 . 这 三 个 方程 都 是 
根据 实验 结果 总 结 出 来 的 ,并 上 且 方程 (4. 2. 15) 与 方程 (4. 2. 16) 对 称 ; 显然 ,如 果 没 有 方 
程 (4. 2. 18), 方程 (4. 2. 17) 就 形 单 影 只 了 . 因此 从 对 称 性 考虑 ,麦克 斯 韦 大 胆 地 假设 了 
方程 (4. 2. 18) 的 存在 ,这 意味 着 电场 的 变化 也 能 产生 磁场 . 据 此 ,麦克 斯 韦 预言 了 电磁 
波 的 存在 ,这 个 预言 30 年 后 被 实验 证 实 . 
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与 之 相应 的 是 ,化 学 家 眼中 的 对 称 性 则 是 “可 爱 的 ”对 称 性 甚至 成 了 结构 化 学 的 基 
础 .有 人 从 分 子 的 对 称 性 . 唱 体 的 对 称 性 、 轨 道 及 波 函 数 的 对 称 性 等 侧面 总 结 了 化 学 中 的 
对 称 性 . 分 子 的 对 称 性 最 直观 ,比如 葵 的 环形 结构 ( 见 图 4-3)、DNA 的 双 螺 旋 结构 、C60 
的 足球 结构 ( 见 图 4- 4). 当然 ,我 们 也 别 忘 了 手 性 分 子 ( 见 图 4- 5). 晶体 的 对 称 性 则 涉及 
3 维 空间 ,如 氧化 钠 即 食盐 的 晶体 结构 ( 见 图 4- 6). 从 原子 轨道 的 角度 分 布 看 ,S 轨道 是 
球形 的 .P 轨道 是 中 心 反 对 称 的 ,d 轨道 则 是 中 心 对 称 的 . 由 原子 轨道 组 成 的 分 子 轨 道 , 按 
键 轴 则 呈 圆 柱 形 对 称 (c 对称 性 ) , 按 通过 键 轴 的 节 面 则 呈 反 对 称 ( x 对称 性 ). 至 于 波 函 数 
的 对 称 性 , 则 依赖 于 全 同 粒子 系 中 粒子 的 不 可 分 辨 性 ,这 使 得 交换 粒子 坐标 前 后 所 得 的 
结果 应 该 描述 的 是 同样 的 状态 , 即 相应 的 波 函数 满 足 


12p(01,2,3…N)| :一 |p(2,1,3，N)|1: 且 op(1,2,3,…,ND) 王 士 p(2,1,3，……N) 
这 样 的 波 函 数 要 么 是 对 称 的 ( 即 满足 p(1,2,3,…,N) 二 p(2,1,3,…,N) ) ,要么 是 
反对 称 的 ( 即 满足 pg(1,2,3,…,N) = 二 一 g(2,1,3,…, NN) ). 


图 4-7 SARS 病毒 
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对 称 不 仅 与 美丽 有 关 , 而 且 也 与 丑陋 相伴 ,如 SARS 病毒 ( 见 图 4- 7)、H7N9 病毒 
( 见 图 4- 8) ,都 有 着 对 称 的 “美丽 ”外 衣 . 想 想 这 也 情 有 可 原 , 因 为 如 果 对 称 性 是 宇宙 的 本 
质 属性 的 话 , 那 万 物 无 论 美 丑 , 自 然 都 会 得 其 春风 雨露 ,毕竟 万 物 丝 平等 . 

至 于 数学 中 的 对 称 性 ,或 许 让 外 尔 (Hermann Weyl,1885 一 1955,20 世纪 上 半 叶 最 重 
要 的 数学 家 之 一 ,主要 成 就 在 黎 曼 曲面 和 群 论 上 ) 来 说 更 合适 . 在 著名 的 “小 册子 ”( 薄 薄 
170 页 多 对 称 》 中 ,他 分 四 讲 阐 述 了 对 称 这 个 深刻 主题 . 在 第 一 讲 中 ,他 开宗明义 ,将 对 称 
性 视 为 优美 和 谐 . 然后 ,他 从 最 简单 的 双 侧 对 称 性 人 手 , 通 过 大 量 艺术 图 片 、 人 体 的 心脏 
和 晶体 的 旋光 性 等 生动 的 例子 ,结合 前 人 的 一 些 哲学 思考 ,间或 伴 以 反射 变换 、 自 同 构 等 
数学 思想 ,引领 读者 深入 思考 对 称 . 接 下 来 在 第 二 讲 中 ,他 首先 引入 群 论 的 基本 概念 ,并 
以 之 考察 了 平移 对 称 性 .旋转 对 称 性 , 饰 带 、 官 慌 . 芽 枝 、 蝇 崔 .音乐 的 节律 、 花 瓶 . 宫 殿 的 
屋顶 教堂 ,水母 .雪花 . 轴 赵 螺 、 向 日 葵 …… 各 种 有 趣 的 例子 琳琅 满目 ,最 后 给 出 了 3 维 
中 的 全 部 有 限 旋转 群 的 完整 表 . 第 三 讲 中 ,他 系统 处 理 了 更 加 复杂 的 装饰 对 称 性 或 晶体 
对 称 性 ,并 将 之 与 琶 合 变换 ( 即 全 等 变换 ) 的 不 连续 群 联 系 起 来 . 最 终 , 在 第 四 讲 里 ,他 表 
明了 “对 称 性 原理 在 性 质 更 为 基本 的 多 的 一 些 物 理 和 数学 问题 中 也 是 起 作用 的 ”, 并 将 之 
前 的 所 有 应 用 上 升 到 “对 于 该 原理 本 映 的 一 个 最 终 的 一 般 陈 述 ”, 也 就 是 伽 罗 瓦 群 . 

拉 格 朗 日 在 创立 了 分 析 力 学 后 ,不 无 遗憾 地 说 :“ 牛 顿 是 最 幸运 的 ,因为 宇宙 的 结构 
只 能 被 发 现 一 次 . ”他 比 牛 顿 晚 出 生 , 只 能 空 自 啼 叹 . 可 他 却 是 伽 罗 瓦 的 前 辈 ,而 且 在 他 的 
《方程 代数 解 之 反思 》(1771 年 ) 中 ,还 引入 了 方程 根 * 置 换 ” 的 思想 ,这 可 是 群 论 的 萌芽 . 不 
过 最 终 揭 开 对 称 性 之 奥秘 的 , 却 是 他 离世 时 刚刚 2 岁 的 伽 罗 瓦 . 


正 交 投影 和 和 斜 投影 应 用 领域 广泛 . 比如 在 无 线 通 信 、 雷 达 、 时 间 序 列 分 析 和 信号 处 理 
等 领域 中 ,经 常 需要 提取 某 个 所 需要 的 信号 ,同时 过 滤 掉 所 有 干扰 或 噪声 . 这 就 仿佛 拍 
照 :我 们 留 下 了 二 维 的 平面 影像 ,但 也 抛弃 了 第 三 个 维度 . 从 哲学 本 质 看 ,就 是 丢掉 次 要 
因素 和 次 要 矛盾 , 紧 紧 抓 住 问题 的 主要 矛盾 . 显然 这 与 拉 格 朗 日 乘 子 法 增加 空间 维 数 的 
提升 手法 正好 相反 . 在 大 规模 计算 中 ,更 需要 通过 投影 方法 将 高 维 问题 降 维 为 低 维 问题 ， 
以 降低 计算 量 . 

定义 4.3.1 寿 丁 空间 ( 欧 氏 空间 )V 有 直 和 分 解 V 二 Vi 名 Vs, 即 对 任意 a EV 有 


直 和 分 解 
C=ota (og EVi,g: EV) (4. 3. 1) 
则 称 线性 变换 
P : C Pa Cd, 2» 


是 V 沿 V 到 Vi 的 斜 投影 变换 (oblique projection transformation), 称 马 在 任意 一 组 基 下 的 
息 阵 王 为 投影 矩阵 (projection matrix). PP 常 被 简称 为 投影 变换 或 投影 算 子 (projector). 

特别 地 , 当 Vi 与 V; 正 交 , 即 V; 二 VL 时 , 称 线性 变换 好 为 正 交 投影 变换 (orthogonal 
projection transformation) 或 正 交 投影 算 子 (orthogonal projector) ,相应 的 矩阵 P 称 为 正 
交 投 影 矩 阵 (orthogonal projection matrix). 
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如 图 4- 9 所 示 , 我 们 可 以 想象 光线 沿 V, 照 向 六 ,这样 a EV 在 Vi 上 的 影子 就 是 
P(g) = o. 至 于 图 4- 10 则 是 光线 沿 Vi 照 向 Vi , 此 时 wxEY 在 W 上 的 影子 仍然 是 
P(g) 一 om.“ 啊 ,亲爱 的 影子 !”( 电 影 (巴黎 圣母 院 ) 台 词 ) 


Pe 


4-9 和 斜 投影 变换 :a a 图 4- 10” 正 交 投影 变换 人 :gm 


影子 的 影子 当然 是 自身 , 即 对 任意 g EV, 投影 变换 PP 满足 : 
Pi(g) =P(P(a)) =P(a)=a = P(g) 

也 就 是 P? 二 PP. 反之 ,可 以 证 明 , 西 空间 ( 欧 氏 空间 )V 中 满足 P? 二 PP 的 线性 变换 也 肯 
定 是 投影 变换 . 因此 投影 变换 玫 又 被 称 为 窘 等 变换 ( idempotent transformation). 

变换 即 矩阵 ,显然 投影 矩阵 也 应 该 满足 严 = P, 即 忆 是 壤 等 矩阵 ( idempotent matrix). 

定理 4.3.1 本 空间 (或 欧 氏 空间 ) Y 中 的 线性 变换 马 是 投影 变换 的 充 要 条 件 是 也 
在 任意 一 组 基 下 的 和 矩阵 P 为 寡 等 矩阵 . 

证 明 : 设 Pp 在 V 的 一 组 基 111， 7172 1， 下 的 矩阵 为 也 ， 则 


P(m ,1 一 (7 ,1 "11 PP 


Pi ma) = PLO mp P| = Pm mp P= Gr ) P: 


由 于 PP 是 投影 变换 , 即 ps =, 因此 (th :Th "P= (th 人) Fr, 此 即 严 一 卫 

友之; 当 P: > 卫 时 , 若 有 Pm ,2 ) (CT » ?2 ,，… 1 ) 卫 ， 则 

Pi2 (nm » M2 CD) = (7 mh sn si P’ = Cm » 2 CE D) P= P(nm » 2 ,0 ) 
即 Ph) 二 全 (Th: 仑 ，… ,全 )， 从 而 P: 二 全 , 即 忆 是 投影 变换 ,证 毕 . 

思考 :Householder 矩阵 是 宕 等 矩阵 吗 ? 即 Householder 变换 是 投影 变换 吗 ? 

正 交 投影 变换 ( 正 交 投影 矩阵 ) 作 为 特殊 的 投影 变换 (投影 算 阵 ) ,其 特殊 性 又 在 何 处 
呢 ? 注意 到 此 时 在 分 解 式 (4.3.1) 中 , (qi,@z) = 二 0, 即 (P(g),@s) 二 0, 因此 

(P(g),0) = (aim To) = (mm ) 0 

这 就 是 说 投影 变换 也 具有 半 正 定 变 换 的 性 质 , 当 然 , 缺 失 的 一 环 是 必须 证 明了 P 是 Her- 
mite 变换 或 对 称 变换 . 

设 刀 为 酉 空间 V 上 的 正 交 投影 变换 ,对 任意 wx, BEV, 设 wx 一 wo 十 迪 , 太 一 床 十 应 ， 
这 里 Cl ,Pi € Vi »， OQ ,Pp [a Vi » 显然 有 (Qi ,pb ) = (@2 ,Pi) 一 0， 以 及 P(a) = Oi ,P(P) 三 = 
PB， 因此 

(Pl(a),P) = (Ci ,Ph 十 应 ) = (Ql Pp 一 〈Cl 十 02 ,Pi) 二 (ag, (P(P) 


即 亿 是 Hermite 变换 . 


第 4 章 特殊 变换 及 其 矩阵 。181 ， 


定理 4.3.2 西 空间 (或 欧 氏 空间 )V 中 的 投影 变换 忆 是 正 交 投影 变换 的 充 要 条 件 
是 忆 是 Hermite 变换 (对 称 变换 ). 

证 明 :必要 性 前 面 已 证 . 下 证 充分 性 . 

设 刀 在 本 空间 V 的 一 组 基 1T1 ,7 ，… ,11 下 的 矩阵 为 P, 则 PP 二 PP 有 是 P" = PP. 设 任 
意 @ EV 在 此 基 下 的 坐标 向 量 为 x, 并 设 w 有 直 和 分 解 (4. 3. 1), 则 P(g) 的 坐标 向 量 为 
Pr , 因此 


(xl 0o) 一 (0 一 01) 一 (0) 一 (oo ) 一 (CPGo),a) 一 (Pa):,P(Ca)) 
= (Px,x)— (Px,Px) = xt!Px — (Px)(Px) 
= x Px — xP Px 一 xpxr 一 xzapx 一 0 


从 而 忆 是 正 交 投 影 变 换 . 证 毕 . 

和 矩阵 即 变换 . 用 和 矩阵 语言 改写 定理 4. 3. 2, 就 得 到 下 面 的 定理 . 

定理 4.3.3 西 空间 (或 欧 氏 空间 )V 中 的 投影 矩阵 已 是正 交 投影 矩阵 的 充 要 条 件 是 
PP 是 Hermite 矩阵 (对 称 和 矩阵 ). 

思考 :Householder 矩阵 是 正 交 投影 矩阵 吗 ? 

正 交 投影 变换 PP 对 应 的 正 交 投 影 矩 阵 忆 到底 是 什么 样 的 矩阵 呢 ? 


省 下 | 
考虑 正 交 投影 变换 P : (zi ,z)THy(Czl,0)T, 注意 到 ( = ( ) 
0 0 0 2 


[= 


1 0 
即 P= l» 关上 再 联想 到 PP 的 像 空 间 为 VV = { (zx,0)T ,zi € 民 } 中 ,不 难 发 现 其 基 
(1,0)7 满足 
1 1 0 
jao= =P 
0 0 


这 是 否 意味 着 PP 的 矩阵 己 就 是 由 好 的 像 空间 的 基 与 其 转 置 相 乘 而 得 的 矩阵 呢 ? 
再 看 看 三 维 的 情形 . 设 有 正 交 投影 变换 P',(z1 Tz ,x3 ) TH (x1 ?2 ;07 注意 到 


宛 1 1 0 0 “el ey 


3 | 三 = 0 粳 0 Ty =P Ny 


\ 0 0 0 0 le 3 
并 且 确 实 成 立 
1 0 1 0 0 
1 0 0 
0 1 一 |0 1 0|=P 
@ 1 9 
0 0 0 0 0 


定理 4.3.4  ( 正 交 投 影 变换 的 矩阵 1) 在 酉 空间 (或 欧 氏 空间 ) 中 , 沿 Vi 到 ; 维 子 
空间 VV 的 正 交 投影 变换 好 在 V 的 任意 一 组 标准 正 交 基 下 的 矩阵 P。 都 可 表示 为 


Py = UU (4. 3. 3) 
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其 中 , Di € C” 是 半 丁 矩阵. 
证 明 设 Qi 02 3 为 Vi 的 任意 一 组 标准 正 交 基 , 且 102 O01 ,Oy 是 V 
的 一 组 标准 正 交 基 ， 则 天 在 CI 02 0 0 0 下 的 矩阵 可 表示 为 


I, O TI 
Pi 三 一 (I, O) 
OO 0 O 
设 刀 在 V 的 任意 一 组 标准 正 交 基 ni » 2 ”和 下 的 矩阵 为 Py 9 并 且 ni » M2 人 
| 直 
到 ai ,as ,…,ou 的 过 渡 矩 阵 为 忆 , 则 己 是 西 矩 阵 , 且 Py = PP,P7', 记 UU =P(0). 显然 
1, 
UTU = (1, O)P"P 一 看 网 
O 


即 DC 是 半 西 矩阵, 并且 


Py (无 OP™*=P 


1 


Ts L: 
= PPiP 王 | (TO)P 一 CDOT 
O O 


证 毕 ， 
说 明 :从 上 述 证 明 可 知 , Ui € Cw* 是 标准 正 交 基 间 的 过 渡 和 矩阵 P 即 西 矩阵 P 的 前 
列 ,是 半 丁 矩阵 . 由 于 PP 是 任意 的 酉 矩阵 ,因此 U, 也 是 任意 的 半 西 矩 阵 . 易 知 式 (4. 3. 3) 
I, O 
中 的 矩阵 P 满足 P 二 P 二 Pa , 因此 Pr 是 正 交 投 影 矩 阵 , 且 由 局 一 代 0) 及 Py, = 
PP1P”“ 知 它 的 特征 值 为 1 和 0. 车 令 P = (pi, ps; pi pn"… ;ps), 则 Ui = (Pi， 
有 2 ，”… 有， 5 且 


P=UU =1. 记 阳 十 1 pp 1 pp tO paptit 0 pp 
二 1]。E l».FE, Ses | la 上 0O。 五 :十 … 十 0， 五 ， 
一 1。 玉 十 1。 肌 十 坟 十 1。 丽 ， (4. 3.4) 


其 中 , E, 二 p,ps (i 二 1,2,…,7) 都 是 秩 1 和 矩阵 . 式 (4. 3.3) 和 式 (4. 3.4) 也 可 看 成 正 交 
投影 矩阵 的 谱 分 解 . 

如 果 仅 仅 知 道 列 满 秩 矩阵 WE C”, 根据 复 和 矩阵 的 UR 分 解 可 知 ,存在 半 丁 矩阵 Di 
E C” 和 上 三 角 和 矩阵 RE C”, 使 得 W=UR, 即 Ul 二 WR7 有 RIR = RIUTUIR 一 
WHW, 从 而 


Py = UU = WR I WR) =WERIR) WY = W WIW WwW. 


定理 4.3.5 ( 正 交 投影 变换 的 矩阵 I) 在 西 空间 (或 欧 氏 空间 )V 中 , 沿 Vi 到 > 维 
村 空间 Vi 的 正 交 投影 变换 PP 在 V 的 任意 一 组 基 下 的 矩阵 P 都 可 表示 为 


P=W WW) Wi (4. 3. 5) 
其 中 , W € C” 是 列 满 秩 矩阵. 
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式 (4. 3.5) 中 的 矩阵 了 也 满足 P? = 二 P= 二 P"', 因此 它 也 是 正 交 投影 矩阵 . 这 样 我 们 就 
能 从 任意 列 满 秩 和 矩阵 环 (注意 风 未 必 是 方 阵 ) 构 造 出 正 交 投影 矩阵 已 至 于 更 一 般 的 投 
影 矩 阵 的 构造 公式 ,请 参阅 文献 L30] 第 690 页 . 

例 4.3.1 已 知 @ 一 (1,2,0)7,os 二 (0,1,1)7, Vi 二 span(@ ,az), 求 正 交 投影 矩 
阵 P 了 及 向 量 x = (1,2,3)7 沿 VL 到 WV 的 投影 . 


1 0 
解 :因为 W= (mv) = |2 1 ,所 以 Ww= (。 ,ww = 十 (， os 
0 1 
从 而 
2 当 = 
P=W (WiW) W 一 地 2 5 1 
一 和 14 弟 


而 且 向 量 x 二 (1,2,3)" 沿 VL 到 Vi 的 投影 为 Px 一 (0,5/2,5/2)'. 

有 些 读 者 可 能 已 经 注意 到 ,在 前 几 章 里 ,我 们 从 特殊 的 向 量 空间 R" 逐步 推广 到 一 般 
的 线性 空间 V, 从 欧 氏 空间 R" 逐步 推广 到 欧 氏 空间 V, 进而 推广 到 西 空间 V. 在 本 章 
里 ,我 们 则 采取 了 一 种 "逆向 工程 ”, 即 从 最 一 般 的 正规 变换 (正规 矩阵 ) 特 殊 到 Hermite 
变换 (Hermite 和 矩阵) 及 半 正 定 变换 ( 半 正 定 和 矩阵 ), 再 特殊 到 正 交 投影 变换 ( 正 交 投 影 矩 
阵 ). 这 些 变换 (和 拖 阵 ) 之 间 的 关系 ,可 如 图 4- 11 所 示 . 至 于 前 面 的 思考 题 ,显然 House- 
holder 矩阵 作为 正 交 和 托 阵 ,不 可 能 是 投影 矩阵 ,更 不 可 能 是 正 交 投影 矩阵 . 


正规 矩阵 AW = 443( 实 正规 矩阵 44 = 447) 


正 交 投 影 和 矩阵 P=P=PMP =P=P"') 


图 4-11 几 种 特殊 矩阵 (变换 ) 之 间 的 关系 


4.4 谱 分 解 的 应 用 
a re DA hl 和 
只 要 我 们 具有 了 逆向 思维 和 计算 思维 ,就 会 发 现 谱 分 解 的 应 用 非常 广泛 . 比如 正规 矩 
阵 A 的 谱 分 解 A 二 UAU", 逆 过 来 看 ,就 意味 着 一 旦 给 定 避 和 人 , 就 能 反 过 来 重 构 出 矩阵 4， 
这 就 是 所 请 特征 值 反问 题 . 而 从 计算 角度 查看 正规 矩阵 4 的 谱 分 解 表达 式 (4. 1. 8), 则 意味 
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着 若 


人 


A = 人 1 ul 十 Asusud 十 Te 十 和 RUAER 


则 随 着 & 的 递增 , A 似乎 越 来 越 “ 双 近 ”最 终 的 A. 
本 市 我 们 只 介绍 谱 分 解 在 信号 处 理 中 的 两 个 应 用 :离散 Karhunen-Loeve 变换 和 主 
成 分 分 析 . 


4.4.1 离散 Karhunen-Loeve 变换 


我 们 先 说 明 几 个 基本 概念 . 

在 信号 处 理 中 ,由 于 噪声 和 干扰 的 大 量 存在 ,观测 数据 通常 取 随 机 变量 xz(&), 即 样 
本 空间 到 实数 集 的 映射 . 其 中 的 样本 点 上 可 以 是 时 间 上 、 圆 频率 广 角 频 率 w 或 位 置 y 等 . 
含有 滩 个 随机 变量 的 实 值 向 量 x (8) 二 Lzi (Ce ,zs( 自 ,… ,zn( 旨 ] 称 为 m 维 随机 向 量 , 常 
简写 为 x. 若 随机 变量 x;(6) 的 期 望 为 下 {z 9) 二 jp, 则 称 (a ,pw，… po) 为 x 的 均值 
向 量 , 记 为 E{x). 

称 mm 阶 方 阵 Elxx') 二 (ri) 为 随机 向 量 x 的 自 相 关 和 矩阵 ,并 记 为 R,. 其 中 六 是 
Xi( 自 的 自 相 关 函 数 , 即 7; 二 E{ 和 Z| (i 二 1,2,… ym) ,ry 是 zx:(&) 与 二 (9 之 间 的 互 
相关 函数 , 即 二 Elzxizxj) (i,j 二 1,2,…,m 且 i 了 关 j). 显然 ,R. 是 半 正 定 对 称 和 矩阵 ， 
即 R, = 0. 

称 m Xn 阶 矩 阵 E{xy'} 一 (Creasy, ) 为 两 个 随机 向 量 x 王 (zzzn)i 与 前尘 
(yi1,yz，"… ,Yn) 之 间 的 互相 关 和 矩阵 , 记 为 R,,, 其 中 7 二 Elziyj) 是 xz; 与 y); 之 间 的 互 
相关 函数 . 如 果 * 与 》 的 互相 关 和 矩阵 为 零 矩 阵 , 即 R,, == 0, 则 称 随机 向 量 x 与 y 是 正 交 
的 , 记 作 x | y 显然 此 时 x 的 任 一 元 素 x; 与 y 的 任 一 元 素 y; 都 是 正 交 的 , 即 它们 的 互相 
关 志 ,二 Elzxiyj) 二 0. 称 Elx'y) 为 随机 向 量 x 与 y 的 内 积 , 记 为 (x,y). 特别 地 , 称 
E(x'x) 为 随机 向 量 x 的 范 数 , 记 为 |x|7. 

设 m 维 随 机 向 量 x 为 某 随机 信号 的 观测 样本 , 且 均 值 向 量 E{x} = 0. 在 信号 处 理 
中 ,通常 将 x 展开 成 一 组 标准 正 交 基 qi ,gq;,… ,gq, 的 线性 组 合 , 使 得 


X 一 MW19g1 十 wzgz 十 … 十 Wwngnydg: | g; (i 12 (4. 4.1) 


记 @= (9 ,92 gm 一 (Wi Was Wn)!, 则 上 式 即 为 x = Ow, 其 中 @ 是 正 交 
算 阵 . 这 实际 上 就 是 对 样本 x 做 正 交 变换 ,从 而 用 另外 一 组 数 w 来 表示 样本 x. 在 这 种 
新 的 表示 下 ,显然 信号 < 相对 于 基 向 量 9 的 各 分 量 wig; 不 会 互相 干扰 ,从 而 就 能 凸显 出 x 
的 某 些 性 质 . 

为 了 减少 变换 后 的 系数 w; 的 个 数 ,通常 假定 只 取 w 的 前 & 个 系数 wi ,ws，…, wi 来 


通 近 x, 即 


这 一 wiqiT+ wg wg (lk<Zm) (4. 4. 2) 
于 是 就 产生 了 通 近 误差 ee, 即 


@: = X= Weg Wiegez 二 二 wgn 一 > wg; 


1 一 人 二 1 


以 及 均 方 误差 Ei's 即 (43 的 范 数 
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E—lal’=Etel es}= 2 grE{|l wl’}g— 2» E{|w:|’) 


由 于 w, = qix, 因此 易 知 E{|wi|*) 二 qiR.qi, 这 里 R; 为 随机 向 量 x 的 自 相关 矩阵. 
这 样 均 方 误差 Ei 就 被 改写 为 


> qiRqisqlqi: =1 (i=k+1,k+2,°,m) (4. 4. 3) 
+ 一 人 | 
为 使 均 方 误差 Es 最 小 化 ,构造 拉 格 朗 日 代价 函数 
J -E+ Dd gq > qiR,gq; + Da ag) 


显然 , J 取 最 小 值 时 er 二 0, 利用 第 7 章 的 相关 知识 ,可 知 此 即 


Rq; =Aq;: 一 & 十 ] ,有 十 2 770) (4. 4. 4) 


设 随机 向 量 x 的 自 相 关 甜 阵 R, 的 谱 分 解 为 R, = > qi9i， 并 且 按 特征 值 从 大 到 小 


排列 , 即 宇 入 三 … 宇 % 宇 0. 要 使 均 方 误差 EE 最 小 , 式 (4.4.2) 中 的 逼近 向 量 守 中 的 
正 交 向 量 组 q1 ,qs，,…， qs 必须 选择 为 R, 的 谱 分 解 中 的 前 & 个 特征 向 量 ,此 时 式 (4. 4. 2) 
中 系数 向 量 市 二 《wi, ws,…, wr)" 一 QFx, 其 中 @ 二 (qi,92，,…,qx) 为 半 正 交 和 矩阵 ,从 
而 均 方 误差 Ei 为 
= 2) giR,g; = 2) qig; = 2 
i=k&+l 一 大 二 1 


当 宇 宇 … 宇 宇 0 是 R， 的 较 大 特征 值 旦 剩 下 的 特征 值 都 很 小 时 ， 均 方 误差 El 
就 会 很 小 ,从 而 就 能 非常 好 地 到 近 x. 这 就 是 离散 Karhunen-Loeve 变换 ,也 称 Hotel- 
ee 变换 . 


4.4.2 主 成 分 分 析 


假设 有 个 统计 相关 的 mx 维 性 质 指标 zi,zz，…,zi， 我 们 希望 通过 某 种 变换 , 重新 
构造 出 个 m 维 的 新 特征 指标 y1,y;，… ,yi， 它们 在 统计 上 互相 独立 , 即 这 些 新 变量 彼此 
正 交 ,不 再 有 信息 元 余 . 这 一 过 程 称 为 特征 抽取 (feature extraction). 显然 ,特征 抽取 的 实 
质 就 是 从 空间 民 " 内 ,抽取 出 &( 1 三 过) 个 彼此 正 交 的 新 变量 , 张 成 空间 RR*, 从 而 将 
存在 元 余 信 息 的 高 维 空间 RR" 变换 成 无 信息 宛 余 的 低 维 空间 R*, 这 种 变换 称 为 降 维 
(dimension reduction). 主 成 分 分 析 (principal component analysis, PCA) 是 一 种 最 典型 
的 降 维 变换 , 它 要 求 按 照 所 谓 “ 能 量 ” 排 序 后 ,这 个 新 特征 指标 具有 原始 指标 的 大 部 分 
能 量 , 即 它们 被 视 为 原始 指标 的 主 成 分 或 主 分 量 . 

定义 4.4.1 称 随机 向 量 x 二 (zi,z2,…,z,)7 的 范 数 |x|? = E{xix) 为 二 的 能 量 
(energy) , 记 为 上 ,. 特别 地 , 当 n 二 1 时 , 称 上 zl? = E{| xz 1} 为 随机 变量 xz 的 能 量 , 记 为 
FE.. 

设 随机 向 量 x 二 (zi,zo，…,z)" 的 自 相 关 算 阵 R, 的 特征 值 为 1 宇和 宇 … 宇 % 主 0， 
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且 其 前 个 特征 值 为 主 特征 值 , 即 它们 是 R, 比较 大 的 特征 值 . 则 主 元 分 析 法 的 步骤 如 下 : 
第 一 步 : 降 维 
由 原始 变量 zi ,zs，,… ,x 构造 上 个 主 分 量 


3 
Mh Dg =Qx= x (= 1,2,.,k) (4. 4. 5) 
t=] 


其 中 ,x 二 (Cziyzz) ,而 oi 二 (Qj,ay，…,aw)' 是 待定 系数 组 成 的 向 量 . 
第 二 步 : 正 交 化 
使 人 个 主 分 量 了 1 成 为 标准 正 交 组 , 即 (y; i 入 2 三 议 , 则 必须 有 Qa; 二 .658 
即 也 二 (oo ,…,o) 是 正 交 和 矩阵 . 
第 三 步 :能 量 最 大 化 
设 随 机 向 量 x 的 自 相关 和 矩阵 R, 的 谱 分 解 为 R, 二 >)) gg7, 取 w 二 9, 则 各 主 分 量 
PE 
的 能 量 》 
» = E{ly|’} = E{(x'g;))' (g/lx)} = E{qglxx'g;} ~ glE{xx'} g; = giR,g; 
= gq} (A1q19! + Xsq2q! 十 十 2g0T)g = gq) (Mj; gq; ql) gq; = (f= 1,2,.…,k) 
因此 五 , 三 E,, 三 … 宇 Ey， 即 主 分 量 的 能 量 逐 渐 降低 . 由 于 
tr(Ri)= {rl} + E{lzz | t+ Elzl’} 一 五。 +E, + +E 
一 Al 十 hz 十 … 十 Al 十) 十 … 十 让 
故 Es = 入 Es er Es 一 Al 十 Az ee 十 人 入 BE 二 4 5 十 及。 9 即 k 个 相互 正 交 的 
主 分 量 的 能 量 之 和 近似 等 于 原来 n 个 随机 数据 的 能 量 之 和 ,损失 的 能 量 Mt 十 X42 十 … 十 
1 非常 小 . 
当 观 测 数 据 来 自 m 个 信道 时 , 设 所 得 数据 序列 为 {x;())), i 二 1,2,…,m,j 二 1， 
pi 记 观 测 数 据 和 矩阵 二 (Xi ) = (Xs ys 其 中 Xj 一 wy). 设 关 的 空间 相 
关 矩 阵 为 R = 二 XX7， 并 设 X 的 谱 分 解 为 X 二 UAU". 
如 果 我 们 希望 从 观测 数据 中 抽取 表示 共性 的 特征 w (7), 使 得 观测 数据 被 表示 成 
X=AD (4. 4.6) 
其 中 , A 二 (4j) (ij 三 1,2,…,m ), 称 为 展开 系数 矩阵 ; 二 (p67)) (i 二 1,2,…,m; 
7] 二 1,2,…,n ) 表 示 的 则 是 m 个 信道 信号 特征 的 矩阵 . 具体 到 元 素 ,就 是 


Xi) = Pargilj) (=1,2,,m;j = 1,2,°,n) (4. 4.7) 
k=1 


在 式 (4. 4. 6) 中 , 需 加 上 的 正 交 归 一 化 条 件 是 二 OOT7 一 ,从 而 及 一 工 4OOT4T 
一 4A4 -1. 
男 外 ,由 R 宇 0 可知, R 的 谱 分 解 为 R = U5! 对?2UT, 因此 


A = 二 UE 或 a = Ak Ux (4. 4. 8) 
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其 中 ， 人 和 (Ui Ui2 9""" ,Ui DS 分 别 是 R 的 特征 值 和 对 应 的 特征 向 量 . 用 AT 左 乘 式 
(4. 4. 6), 并 注意 到 式 (4. 4. 8), 可 知 


4TIX 一 4I40 = DT UU GD = SD 
此 即 四 = 五 14IX 一 4I40 一 允 '2UTX, 写成 列 向 量 形式 ,就 是 


qo1(7) AT ul A ul ay 
G2 (J) Xz wu2 Mz U2 
3 三 (7 = 1,2,*",n) 
Gm (7) pi 1 pe 
也 就 是 
iD = A x; (i= 1,2,,m) (4. 4.9) 


这 里 gp,(j) 相当 于 空间 信号 向 量 x 本 身 与 第 i 个 特征 向 量 wu; 相关 联 的 主要 分 量 , 即 主 
分 量 . 
利用 正 交 归 一 化 条 件 , 可 算得 第 i 个 信道 观测 信号 的 功率 为 
一 于 二 = 了 31 2 Paarg, (j) p17)) 


Ws 


= > Dae (don Dn) > (4. 4. 10) 
| 二 


结合 式 (4. 4. 7) 可 知 , 式 (4. 4. 10) 反映 了 第 个 特征 子 波 gi(j) 对 第 i 个 信道 的 功 
率 贡 献 . 另外 结合 式 (4. 4. 8) 和 式 (4. 4. 10), 可 知 


m n 
2 和 
B. > > a 一 A; > Ux 一 A; 
s=1 k=1 


此 即 R 的 第 i 个 特征 值 3; ,反映 了 第 i 个 特征 子 波 g;()) 在 功率 中 的 贡 

综 上 可 知 ,从 功率 角度 看 ,只 有 与 比较 大 的 特征 值 即 主 特征 值 4, es 的 特征 子 波 
gi(7) 的 贡献 比较 大 ,因此 选择 这 些 特征 子 波 , 便 能 足够 描绘 出 m 个 信道 的 空间 信号 
也 就 是 说 , 如果 R 只 有 上 个 主 特征 值 ,那么 只 要 提取 相应 的 个 主 特征 子 波 p10))， 
gz (让 ,gr(j) 即 可 ,此 时 观测 信和 号 的 展开 式 为 


Ti) = aap (Tag (TT apelj) (=1,2,,m; j= 1,2,.,n) 


4.5 和 矩阵 的 奇异 值 分 解 


从 1873 年 被 提出 至 今 ,奇异 值 分 解 (singular value decomposition ,SVD) 已 经 成 为 
矩阵 计算 中 最 有 用 和 最 有 效 的 工具 之 一 ,并 在 最 小 二 乘 问题 ,最 优化 .统计 分 析 、 信 和 号 与 
图 像 处 理 、 系 统 理论 与 控制 等 领域 得 到 广泛 应 用 . 
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4.5.1 从 几何 观测 说 起 


如 图 4 一 12 所 示 , 圆 S 经 过 线性 变换 4 的 作用 , 变 成 了 椭圆 4 S, 即 单位 圆 在 线性 变 
换 4A 下 的 像 是 一 个 椭圆 , 圆 的 正 交 方 向 ,v2 (一 般 取 单位 向 量 ) 分 别 变 成 了 椭圆 的 长 轴 
ou 和 短 轴 02 U2. 


图 4-12 2Xx2 和 矩阵 的 SVD 


推广 到 守 维 后 情况 如 何 呢 ? 设 和 矩阵 4 € RR (m 宇 n) 对 应 的 线性 映射 为 4. 一 般 
地 , R” 中 的 单位 球面 
S= {x= ar,7)T € RI|x|<1} 


经 过 线性 映射 4 作用 后 变 成 R” 中 的 超 椭圆 (Hyperelliptic curve)A S, 即 在 某 些 正 交 方 
向 吉 wow E 民 ”上 ,以 某 些 因子 wo，…o (可 能 为 零 ) 拉 伸 R” 中 的 单位 球面 后 
所 得 的 曲面 ,向 量 mm ,oz ，…onun 称 为 超 椭圆 的 主 半 轴 (Cprincipal semiaxe) ,长 度 依次 
为 mo，…'oo， 并 且 恰 好 有 个 长 度 非 零 , 这 里 > = r(A). 这 就 是 说 单位 球面 在 任意 线 
性 映射 4 下 的 像 是 一 个 超 椭圆 . 

假定 矩 阵 A € Rw (m 三 nn ) 是 列 满 秩 矩阵 , 则 R” 中 的 7 个 正 交 方 向 mm 
变 成 了 超 椭圆 的 主 半 轴 giw ,6ztw，… ,owu, 我 们 称 A S 的 个 主 半 轴 的 长 度 o1 ,oa 
(ol 三 中 二 人 全 om 二 0, 习惯 上 按 降序 编号 ) 为 矩阵 4 的 奇异 值 ( singular value) ,单位 
问 量 ww ,tw ，…,u 称 为 矩阵 A 的 左 奇异 向 量 (left singular vector) ;它们 张 成 的 空间 称 为 
左 奇异 空间 (left singular space) , 左 奇异 向 量 的 原 像 ,vs,…,v 称 为 4 的 右 奇 异 向 量 
(right singular vector) ,它们 张 成 的 空间 称 为 右 奇 异 空间 (right singular space). 显然 , 适 
当 编 号 后 应 成 立 Av; 二 ojuj (7 一 1,2,*…,n). 

思考 :上 述 的 左右 奇异 向 量 似乎 与 图 中 的 左右 相悖 ,何以 要 采取 这 样 的 定义 呢 ? 

前 面 已 经 指出 Av; 二 oju; (J 二 1,2,…,n), 即 


A sb» 人 a (Ui 9 12 ,diag(al »02 oO 


写成 矩阵 形式 , 即 为 AV = UE, 这 里 矩阵 疾 是 半 酉 和 矩阵, 是 本 矩阵 ,这样 就 得 到 人 
的 约 化 (reduced) 奇 异 值 分 解 ,如 图 4- 13 所 示 . 


A = UEV! (4.5.1) 
观察 式 (4. 5. 1), 现在 你 该 明白 左右 奇异 向 量 名 称 的 来 源 了 吧 . 
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nxn mxn nxn nxn 


图 4-13 约 化 SVD( mm 三 1) 


入 


互 


同样 地 ,将 半 丁 矩阵 已 扩 充 为 mm 阶 酉 矩阵 口 , 并 邻 允 二 | 一 | , 则 得 4 的 完全 (full) 奇 
O 


异 值 分 解 ,如 图 4 一 14 所 示 . 
A = UBEV' (4. 5. 2) 


也 就 是 UAVY 一 忌 


WXxH mxm nxn 


图 4-14 完全 SVD(m 宇 ) 


至 此 ,我 们 给 出 SVD 的 正式 定义 如 下 : 
定义 4.5.1 对 任意 矩阵 4 € C”™” (不 要 求 m 宇 n, 也 不 要 求 4 满 秩 ) , 称 


A = UEV' (4. 5. 3) 


为 矩阵 4 的 一 个 (完全 ) 奇 异 值 分 解 ,其 中 U €E C”™ 是 半 西 矩阵 , YE C” 是 酉 和 矩阵 ， 
蕊 EC” 是 “对 角 和 矩阵 ”( m 宇 nn 时 上 方 是 一 个 n 阶 对 角 阵 , m 二 n 时 左 侧 是 一 个 m 阶 对 
角 阵 ) ,而 且 允 中 的 对 角 元 o1,0s,… ,oj 都 非 负 且 以 非 增 的 次 序 排列 , 即 o 宇 o0; 宇 … 宇 o， 
宇 0, p= min(m,n). 

从 变换 的 角度 来 看 式 (4. 5. 3), 可 知 RR” 中 的 单位 球面 在 任意 线性 映射 4 = UBV" 
下 的 像 一 定 是 R” 中 的 一 个 超 椭 圆 . 具体 地 说 , 西 变换 YE 保持 球面 不 变 , 对 角 和 矩阵 五 将 
球面 拉 伸 到 一 个 有 标准 基 的 超 椭圆 ,最 后 西 变换 U 旋转 或 镜 射 这 个 超 椭圆 ,但 不 改变 它 
的 形状 . 如 果 将 完全 奇异 值 分 解 用 于 线性 方程 组 Ax = 也 的 求解 , 则 当 A 是 可 首 方 阵 时 ， 
显然 可 知 吕 ,及 ,V 也 是 可 逆 方 阵 , 从 而 


U 4 Vv 
六 一 一方 一 万 一 大 一 人 一 (4. 5. 4) 


即 原 方程 组 的 求解 问题 被 分 解 成 三 个 特殊 的 线性 方程 组 的 求解 问题 . 
从 矩阵 等 价 的 角度 看 ,SVD 充分 利用 了 两 矩阵 4 .了 B 的 西 等 价 (unitary equivalence)， 
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即 存在 西 和 矩阵 P,@ 使 得 PAQ = B. 这 样 的 处 理 , 实 际 上 是 放宽 了 Schur 分 解 中 西 相 似 的 
要 求 ,也 就 是 去 掉 了 酉 相似 中 西 矩 阵 P.Q 之 间 的 约束 关系 : P” 一 @, 但 仍然 保留 了 酉 性 
( 正 交 性 ) 优 越 于 等 价 性 的 优点 . 作为 失去 约束 关系 的 弥补 , 它 自然 收获 了 比 Schur 分 解 
中 的 上 三 角 算 阵 TT 更 特殊 的 标准 型 玫 , 也 就 是 与 第 1 章 中 的 标准 型 Ns 类 似 的 标准 型 . 在 
保持 西 性 ( 正 交 性 ) 约 束 下 ,这 已 是 终极 的 标准 型 . 

定理 4.5.1 对 任意 矩阵 A € C”, 都 存在 一 个 完全 奇异 值 分 解 (4. 5. 3), 并 且 奇 
异 值 (0; ); 是 唯一 确定 的 ,也 就 是 任意 矩阵 都 酉 等 价 于 对 角 阵 . 

此 定理 的 证 明 在 下 一 小 节 末尾 给 出 . 

SVD 与 特征 值 分 解 有 根本 的 区 别 . 第 一 是 基 的 数目 不 同 ,SVD 用 了 两 组 不 同 的 基 
( 左 奇异 向 量 和 右 奇异 向 量 ) ,而 特征 值 分 解 只 用 一 组 基 ( 特 征 向 量 ); 第 二 是 基 的 性 质 不 
一 样 ,SVD 使 用 了 正 交 基 , 而 特征 值 分 解 所 用 的 基 未 必 正 交 ; 第 三 是 适用 的 矩阵 不 一 样 ， 
SVD 适用 于 所 有 和 矩阵 (包括 长 方 阵 ) ,而 特征 值 分 解 只 适用 于 特定 的 方 阵 ( 并 非 所 有 的 方 
阵 ) ;第 四 是 应 用 范围 不 同 ,SVD 趋 于 侧重 包含 矩阵 自身 及 其 逆 的 问题 ,而 特征 值 则 趋 于 
侧重 包含 有 迭代 的 问题 (如 抢 阵 的 寡 及 和 矩阵 指数 函数 ). 

Matlab 中 提供 了 内 置 函数 svd, 可 用 于 求 和 矩阵 A 的 奇异 值 分 解 . 调用 格式 


[U,S,V]= svd(A), [U,S,V]= svd(A,0), [U,S,V]= svd(A,' econ'), 


分 别 返 回 A 的 完全 SVD. 约 化 SVD 和 男 一 种 约 化 SVD. 两 种 约 化 SVD 的 区 别 在 于 当 
m 二 nn 时 ,前 者 返回 的 矩阵 S$ 与 4 同 维 且 六 是 本 和 抢 阵 ,而 后 者 返回 的 矩阵 $ 是 方 阵 且 V 
是 nn Xm 阶 半 本 和 矩阵. 

另外 Matlab 中 也 提供 了 内 置 函 数 svds, 可 用 于 求 和 矩阵 A 的 “部 分 ”奇异 值 分 解 . 例如 
调用 格式 


S= svds (A) ,S= svd(A,k),S= svd(A,k,sigma) 


分 别 返 回 矩 阵 A 的 前 6 个 奇异 值 \ 前 & 个 最 大 奇异 值 和 最 接近 sigma 的 个 奇异 值 . 详 见 
Matlab 帮助 文档 . 


4.5.2 由 SVD 导出 的 矩阵 性 质 


SVD 深刻 地 揭示 了 和 矩阵 的 结构 ,能 帮助 我 们 很 好 地 处 理 和 矩阵 中 的 “黄金 ”, 即 矩阵 
的 秩 . 

定理 4.5.2 设 ” 表 示 和 矩阵 4 € C”” 的 非 零 奇异 值 的 数目 (> 迄 min(Cm ,zz)), 则 7 一 
r(A). 

证 明 : 由 于 式 (4. 5. 3) 中 的 矩阵 UV 都 是 满 秩 阵 ,因此 (4) = -CE) 一 ~ 

定理 4. 5. 2 说 明 SVD 可 用 于 计算 和 矩阵 的 秩 . 事实 上 ,Matlab 中 计算 矩阵 秩 的 内 置 函 
数 rank, 就 是 基于 SVD 实现 的 . 其 实现 代码 大 致 如 下 : 


s= svd(A); tol = max(size(A))* eps (max(s))7 工 = sum(s> tol); 
显然 其 中 涉及 tol 这 个 缺 省 阅 值 (threshold) ,这 是 因为 在 数值 计算 中 非常 小 的 非 零 奇异 
值 会 被 视 为 0, 因 此 这 样 求 出 的 秩 被 称 为 数值 秩 (numerical rank) ,以 区 别 于 理论 秩 . 要 想 
得 到 更 接近 理论 秩 的 结果 ,可 采用 Matlab 提供 的 调用 格式 rank(a,tol) ,并 指定 更 小 的 立 
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值 . 例如 
H= hilb (20); % 使 用 内 置 函 数 hilb 生成 20 阶 的 Hilbert 矩阵 
r= rank (H) % 计 算 吾 的 秩 ,计算 结果 为 r* 王 13 ,理论 解 为 rz 一 20 
rl= rank (Heps^2) % 将 阀 限 tol 设置 为 eps2 ,计算 结果 为 zl 一 20 


另外 ,定理 4. 5. 2 也 深刻 地 解释 了 拥有 零 奇 异 值 的 方 阵 何以 被 称 为 是 奇异 的 ( 即 秩 
是 亏损 的 ) , 换 句 话说 , 零 奇 异 值 刻 划 了 方 阵 的 奇异 性 . 而 对 于 长 方 阵 , 显 然 零 奇 异 值 也 意 
味 着 矩阵 不 是 满 秩 的 ( 既 不 行 满 秩 也 不 列 满 秩 ) , 即 矩 阵 的 秩 也 是 亏损 的 , 

用 矩阵 4 的 左右 奇异 向 量 也 可 以 非常 方便 地 表示 N (4) 和 R(A). 

定理 4.5.3 设 r 表 示 和 矩阵 A EC” 的 非 零 奇 异 值 的 数目 (7 之 min(m,n)), 上 且 矩 
阵 A 的 完全 SVD 分 解 为 A 三 UBEY , 其 中 避 王 (友和 VV 二 Gy, ,by,), 则 


R(A) = Span( yu ,°° yu,), N(A) = span(y sv ss, ,) (4. 3, 33 
证 明 : 将 4 的 完全 SVD 分 解 分 块 为 
,ww [BF OfVENr 
4 一 (CU U,) = UBVE 
O OlVijnom—r 


其 中 ， Ui 一 (yz du), Vi 一 (my 六 )， 于 是 有 


R(A)= ({y| y= Axr}={y| y= U (BVix)} CC RU) 
RU)= {yl|y=Uz} = {y|y=AVD'z)) CR(A) 


从 而 
R(A) RU') =3 span(u 1 1 ) 
N(A)= {x|Ax=0}= {x| (UVIx) 一 0) 
= {x|Vix=0)= {x|x EV,) 
= span(yi sy Ve yy ) 
证 毕 . 


既然 矩阵 4 的 非 零 奇异 值 对 应 将 球面 拉 伸 为 超 椭圆 时 各 主 半 轴 的 拉 伸 因子 ,而 特征 
值 也 表示 某 种 拉 伸 的 倍数 ,那么 两 者 间 存 在 什么 关系 呢 ? 
定理 4. 5.4 任意 矩阵 4E C ”的 非 零 奇 异 值 c, 这 os 宇 … 宇 o, 二 0 就 是 矩阵 AH8A 
或 44 ”的 非 零 特 征 值 的 平方 根 . 
证 明 : 设 4 的 SVD 分 解 为 4《=UZEYV8 , 则 
A"A = (UEV I UPBVY) = VBE) VB = (VI ED) V 


即 A" 与 如 允 相似 . 易 知 对 角 和 矩阵 豆 允 的 个 特征 值 为 of … ,0 ,0,…,0 (77 过 min(mm,n))， 
因此 A"A4 的 非 零 特征 值 of,…,o? 的 平方 根 就 是 A 的 非 零 奇异 值 cl ,mm ,… ,0 

对 于 AA 的 m 个 特征 值 ,有 类 似 的 计算 . 证 毕 . 

特别 地 ,对 于 某 些 特殊 矩阵 ,除了 符号 上 的 差异 外 ,奇异 值 “几乎 ”就 是 特征 值 . 

定理 4.5.5 Hermite 矩阵 4 的 奇异 值 就 是 它 的 特征 值 的 绝对 值 . 
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证 明 : 设 Hermite 矩阵 4 的 谱 分 解 为 4 二 QUA[ 广 , 这 里 U 为 西 和 矩阵 , A 为 实 对 角 和 拖 
阵 . 令 |4| = diag(|) | ,| ),sign(4A) = diag(CsignC )，…,sign())， 则 


A=UAU"=U|Al|sign(A)U" (4 5..6) 


易 证 和 矩阵 sign(4)U" 是 本 和 矩阵 ,所 以 式 (4. 5. 6) 就 是 , 4 的 一 个 SVD. 显然 A 的 奇异 
值 就 是 矩阵 1A| 的 对 角 元 , 即 4 的 特征 值 的 绝对 值 . 证 毕 . 

推论 4. 5.1 实 对 称 和 矩阵 的 奇异 值 就 是 它 的 对 角 元 的 绝对 值 . 

熟悉 多 元 统计 分 析 的 读者 都 知道 ,定理 4. 5.4 中 出 现 的 矩阵 AA 和 448 就 是 协 方 
差 和 矩阵 (covariance matrix) ,这 说 明 SVD 也 可 以 在 多 元 统计 分 析 中 大 展 拳脚 ,事实 上 也 


确实 如 此 . 

最 后 ,我们 给 出 定理 4. 5. 1 的 证 法 如 下 . 注意 不 能 使 用 前 面 的 几 个 性 质 ,以 免 循 环 
论证 . 

证 明 : 


由 于 (4 4 六 一 404, XGAn4A)Y 一 (CAr)nC4xr) 二 上 Ax|? 三 0, 所 以 ANA 宇 0. 又 因 

为 方程 组 A"Ax 二 0 与 Ax 一 0 同 解 , 所 以 r(C4An4) 二 7(4) 一， 从 而 可 设 4H4 的 Schur 
分 解 为 

VH(CAHEA)T 一 diag(a，…,o2) (4.5.77 


其 中 ,VY 三 (ni 屿 7 vaoi 症 雪人 mw 人 0 一 on 一 or 一 一 oa 
令 配 = (@ i sb sb) ,Vs == (pl 9 了 -2 yw 芒 )) 瑟 一 diag(o 02 Or) 则 由 式 CS) 
可 知 


VI(ANA)Vi =»:, VH(AHA)V,=0O0 
这 说 明 4W; 的 列 互相 正 交 , 同 时 AV; 的 列 都 是 零 向 量 , 即 AV, = O. 
令 UUi 二 AV1 允 1, 则 UPU 二 将 Ui 扩充 为 0U= (U1,Us), 这 里 Us € Cw ， 使 
U 成 为 C” 的 一 组 标准 正 交 基 组 成 的 矩阵 , 则 


Ur UrAV, Uf'AV, 5 O 
UAV = A(Vi,V;)= 三 
Us USAV: UBAV; O O 
从 而 得 到 A 的 完全 奇异 值 分 解 
互 O 
A=U WH (4. 9. 8) 
O O 
要 3 > 5 OV {Ur 人 
同时 也 可 得 到 4 的 约 化 奇异 值 分 解 和 一 (DUO oj 加 |= 忆 24 证 毕 


ER 2 0 
注意 式 (4. 5. 8) 中 的 (0) 与 式 (4. 5. 3) 中 的 台 对 应 . 两 者 尽管 符号 不 同 ,但 


表达 的 是 同一 种 对 角 状 矩阵 ,有 时 为 表述 方便 ,常用 允 统 一 来 代表 这 两 种 表示 , 即 规 
wns | 0 
定 互 一 二 
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4.5.3 SVD 的 算法 


根据 定理 4. 5. 1 及 定理 4. 5.4 的 证 明 过 程 , 即 得 计算 SVD 的 如 下 算法 : 

第 一 步 ,形成 4"A, 并 计算 其 特征 值 分 解 A"A 二 VAV™, 并 做 分 块 V 二 (Vi ,Vs); 
第 二 步 , 令 允 为 A 的 非 负 对 角 元 的 平方 根 ,计算 U 二 AV15 1 (因为 4 == U1BW1 ); 
第 三 步 ,通过 求 A4"y = 0 的 解 空间 的 标准 正 交 基 ,得 U;, 从 而 得 U 二 (Ui ,U,). 
例 4.5.1 求 下 列 矩 阵 的 完全 SVD 分 解 和 约 化 SVD: 


1 0 1 1 0 
2 0 1 
(DA 一 | 了 于 ;区 二 = lo 1 (ia =| ): 
1 2 0 
Q 有 和 可 | © 
1 面世 2 1 0 
解 :(1) ATA 二 10 1 1|,A47 一 |1 2 0|, 和 矩阵 4rA 的 特征 值 分 别 为 3,1,0, 对 
1 1 2 0 0 0 


本 放 1 1 中 1 
应 的 单位 特征 向 量 分 别 为 8&1 一 去 (1,2)7,e 一 元 (1 一 1,0)7,8 一 二 (1 一 DT， 
' /6 V3 “gh 


从 而 VY = 二 (81182,83), V1 一 (8 ,52 ) , 互 一 diag(V3 ,1). 计算 得 


4 1 
V2 V2 
UD=AViE'=|1 一 ! 
WA2 江 
0 0 
解 A4'y 二 0, 得 基础 解 系 局 二 (0,0,1)7, 从 而 Us = 二房 ,U 二 (U1,U,), 故 所 求 完全 
SVD 为 
sO V3 0 外 
A=U| w= g 1 IV 
O oO 
0 0 0 
由 于 4 是 方 阵 , 故 4 的 约 化 SVD 与 完全 SVD 相同 . 
| 
和 2 0 
C2) A'A4=( 1 ) "447 = 0 1 0|, 和 矩阵 4T4 的 特征 值 分 别 为 2,1, 对 应 的 正 交 
1 @ 1 


特征 向 量 分 别 为 1 (1,0)T,g» 一 《5 工 ) 从 而 VV = (8 ,£2) =Vi js diag(CV2 ,1). 评 
算得 


Ui = AVID 一 |0 | 
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解 44 7y 二 0, 得 其 基础 解 系 为 房 = 着 (一 1,0,1)7, 从 而 三 房 , 避 王 (iD2) ,因此 所 


6 
V2 0 V2 -ee 
求 完 全 SVD 为 4= 了 | 0 1lv”, 约 化 SVD 为 4 一 UUW" 一 | 0 | "| 
0 0 二 首 
M2 
5 8 2 
(3) 44=|2 4 0|, 其 特征 值 分 别 为 7,3,0, 对 应 的 单位 特征 向 量 分 别 为 
& 道 了 
,ee 1 【2 一 二 一 4 ,从 而 入 = (81 v8 3 
V14 V6 V21 
下， 并 
5)，Vi 一 (8l 8) ,也 一 diag(V7 ,V3). 计算 得 Di 二 AV1D 1 一 a we . 令 U=U0, 则 
V2 V2 
, dr 0 
所 求 完全 SVD 为 4 一 0| 局 ed sh dd 


说 明 : 显 然 此 时 4 的 约 化 SVD 仍然 可 表示 为 4 二 U0 及 Vi 人 ,其 中 马 一 diagCV7 ,V3). 
例 4.5.2 (奇异 值 的 敏感 性 ) 考 察 Matlab 测试 矩阵 库 中 的 gallery(3) , 即 下 列 拢 
阵 A 的 特征 值 分 解 与 奇异 值 分 解 : 


27 9 25 
计算 可 知 矩 阵 A 的 特征 值 为 4 二 1,Xs 一 2,s 二 3, 并且 每 个 特征 向 量 都 整数 化 处 理 


出 一生 爷 
《 即 乘 以 适当 倍数 使 得 元 素 都 变 成 整数 ) 后 组 成 的 矩阵 为 X = | 一 3 9 一 妇 |, 显然 
0 1 9 
仍 有 4 三 XAX , 即 
149 一 50 一 154 j 一生 了 让 问 130 43 133 
537 180 546 |= | 一 3 9 一 49 名 27 9 28 
27 9 25 0 1 9 3. 一 3 一 1 一 3 


计算 可 知 4 的 奇异 值 为 cl 817. 7597,o 一 2. 4750,m 二 0. 0030, 注意 到 gallery(3) 
的 三 个 特征 值 差别 不 大 ,但 三 个 奇异 值 之 间 却 存在 如 此 巨大 的 差别 . 这 是 因为 在 上 述 
SVD 算 法 中 ,问题 被 转化 为 特征 值 问题 ,但 遗憾 的 是 特征 值 问题 对 扰动 可 能 有 很 高 的 灵 
敏 性 ,尤其 是 当 和 矩阵 为 非 对 称 和 矩阵 的 时 候 , 因 此 上 面 这 个 算法 是 不 稳定 的 . 
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最 后 我 们 简单 介绍 一 下 SVD 的 数值 算法 的 思想 . 读者 可 与 上 述 算法 做 对 比分 析 . 

数值 计算 中 , 求 Hermite 矩阵 特征 值 的 变换 算法 一 般 分 两 个 阶段 , 即 先 把 矩阵 约 化 
为 三 对 角 和 矩阵 ,再 把 三 对 角 和 矩阵 对 角 化 . 因此 计算 SVD 时 , 先 把 矩阵 化 为 双 对 角形 式 ( 称 
为 Golub_Kahan 双 对 角 化 ) ,然后 再 把 双 对 角 和 矩阵 对 角 化 (例如 用 QR 算法 ). Matlab 中 
实际 采用 的 是 这 种 算法 . 

以 三 nn 时 的 m Xn 阶 和 矩阵 A 为 例 .Golub-Kahan 双 对 角 化 的 思想 就 是 在 矩阵 A 两 
侧 交 蔡 进 行 Householder 变换 ,也 就 是 寻找 上 双 对 角 和 矩阵 B, 使 得 


0 Ni 


Yl 


一 旦 式 (4. 5.9) 成 立 , 则 有 VHANAVI 二 VHAHUIUHAV' = (BY ,O) () 二 BNB. 由 于 
BB 是 一 个 对 称 三 对 角 和 矩阵 ,因此 式 (4. 4. 9) 相当 于 把 矩阵 Aa4 三 对 角 化 . 接 下 来 再 计 
算 阶 上 双 对 角 和 矩阵 B 的 SVD: B = Us,zV8, 其 中 UU,,V 为 nn 阶 西 矩 阵 . 令 U, = 
diag(D ,TV = V,, 则 


B UB B_ UBB| USBV, 五 
Us | = V, = V, = = 
LO T| LO O O O 
从 而 得 到 4 的 SVD 
B 2 p> 
A=U Ve VW Ds VEYH -= VE 
O 


其 中 U = UiD; 和 VS= ViV, 都 是 酉 和 矩阵. 
4.5.4 ”SVD 教授 


“Professor SVD”, 这 是 莫 勒 (Moler)2006 年 撰写 的 一 篇 文章 的 
题目 ,位 于 MathWorks 公司 专门 提供 给 他 的 博客 “Cleve’s Corner” 
里 . 该 文 是 为 了 纪念 矩阵 计算 领域 拥有 这 一 荣誉 称号 的 巨 壁 戈 卢布 
教授 (Gene Howard Golub, 见 图 4- 15) ,这 个 称号 甚至 成 了 他 的 个 
性 车 牌 ( 见 图 4- 16). 

戈 卢布 出 生 于 大 萧条 期 间 的 芝加哥 ,父母 都 是 来 自前 苏联 的 犹 
太 移 民 . 5 岁 时 ,因为 生活 艰难 ,母亲 去 做 了 缝 帽 女 工 ,这 让 他 的 幼儿 
园 教育 比 别 人 更 扎实 . 到 了 12 岁 , 他 开始 在 亲戚 家 的 药房 里 做 送 货 
图 4-15 戈 卢布 员 . 15 岁 时 父母 离异 ,次 年 父亲 撒手 人 赛 . 药房 经 历 使 他 立志 要 成 为 

(1932 一 2007) ”一 名 化 学 家 ,但 家 庭 的 贫困 使 得 他 只 好 选择 了 一 所 社区 大 学 . 在 那里 


。196 。 矩阵 分 析 与 计算 


他 修 读 了 解析 几何 和 分 析 , 并 尝 到 了 其 中 的 无 穷 乐趣 ， 
于 是 历史 上 又 少 了 一 名 化 学 家 (还 记得 施 瓦 茨 吗 ). 他 
考 入 芝加哥 大 学 数学 系 , 后 决定 去 伊利 诺 斯 大 学 完成 
他 的 学 业 . 这 是 个 改变 他 一 生 的 决定 . 

在 伊利 诺 斯 大 学 ,他 学 到 了 和 矩阵 论 、 多 元 统计 分 
析 、 因 子 分 析 等 知识 , 修 读 了 一 门 计算 机 编程 课程 ,并 
在 计算 机 实验 室 担任 助教 . 要 知道 那 时 是 1953 年 ,计算 机 刚 诞生 不 久 ! 虽然 他 没 修 读 过 
数值 分 析 课 程 ,但 从 所 阅读 的 大 量 代码 中 他 学 到 了 很 多 . 拿 到 数理 统计 硕士 学 位 后 ,他 在 
导师 陶 伯 (Abraham Haskel Taub,1911 一 1999, 美 国 著名 数学 家 和 物理 学 家 ,主要 贡献 在 
于 早期 的 广义 相对 论 、 微 分 几何 和 微分 方程 ) 的 指导 下 人 研究 切 比 雪夫 多 项 式 在 线性 方程 
组 求解 中 的 应 用 ,从 此 开始 终身 从 事 数值 分 析 的 研究 . 

SVD 算 法 的 诞生 过 程 非常 有 趣 . 1960 年 前 后 , 戈 卢布 在 剑桥 大 学 听 过 兰 乔 斯 (Cornelius 
Lanczos,1893 一 1974) 关 于 SVD 的 讲座 , 留 下 深刻 印象 . 到 了 1963 年 ,在 斯 坦 福 大 学 一 次 
关于 用 投影 法 计算 伪 首 的 讲座 快 结束 时 ,主持 人 福 赛 思 (George Forsythe,1917 一 1972， 
斯 坦 福 大 学 计算 机 系 的 创办 人 ) 询 问 是 否 有 人 愿意 来 说 说 怎么 计算 和 矩阵 的 伪 逆 ,这 仿佛 


一 道 出 发 令 , 让 他 想到 兰 乔 斯 的 讲座 . 他 开始 让 助手 计算 B 一 (人 ) 的 特征 值 ,因为 


4 的 奇异 值 就 是 B 的 特征 值 的 绝对 值 . 使 用 特征 值 计算 程序 ,他 们 发 现 得 到 的 三 对 角 矩 
阵 的 对 角 元 为 零 . 经 过 研究 并 结合 自己 以 往 的 工作 , 戈 卢布 意识 到 可 以 通过 重 排 矩阵 以 
得 到 双 对 角 怎 阵 . 经 过 一 番 苦 思 , 戈 卢布 找到 了 双 对 角 化 的 途径 , 即 两 侧 都 使 用 正 交 变 
换 . 到 了 秋季 ,他 在 一 次 学 术 会 议 上 遇 到 也 在 思考 同一 问题 的 卡 享 , 于 是 两 人 决定 合 

在 福 赛 思 的 邀请 下 , 卡 享 访问 了 斯 坦 福 大 学 ,于 是 就 诞生 了 那 篇 著名 的 论文 . 

多 年 后 ,有 位 学 者 来 斯 坦 福 大 学 做 演讲 . 演讲 中 间 , 他 紧张 地 问 听 众 :“ 你 们 知道 SVD 
吗 ?” 答 案 马 上 就 来 了 :你 现在 在 SVD 总 部 (headquarters)1” 后 来 特 雷 弗 腾 (Lloyd Nick 
Trefethen,1955 一 ,世界 顶尖 的 数值 分 析 学 家 ) 专 门 设计 了 一 件 文化 衫 ,上 面 印 着 “SVD 
HQ”. 

我 们 必须 谈 谈 《矩阵 计算 这 本 打上 罚 之 作 . 该 书 紧 紧 围绕 矩阵 计算 中 的 三 大 核心 问题 
(线性 方程 组 求解 .最 小 二 乘 问题 和 和 矩 阵 特 征 值 问 题 ), 系统 介绍 了 和 矩阵 计算 的 基本 理论 
和 方法 . 书 中 还 给 出 了 千 余 条 参考 文献 . 如 此 丰富 的 营养 自然 滋养 了 一 代 代 学 子 , 因 此 它 
成 了 大 家 的 “圣经 ”. 在 中 国 , 早 在 1989 年 , 袁 亚 湘 院士 就 以 之 作为 中 科 院 的 研究 生 教 材 . 

蕊 卢布 的 贡献 真是 无 远 弗 届 ,他 的 书籍 和 文章 达到 几 百 本 (篇 ) 之 巨 ,涉及 合作 者 几 
百 余人 . 而 且 他 的 文章 含金量 相当 高 ,2007 年 牛津 大 学 出 版 社 甚至 以 《和 矩阵 计算 中 的 那些 
里 程 碑 ) 为 题 出 版 了 他 的 著作 选集 . 

翡 伤 的 时 刻 早 晚会 来 的 ,但 对 臣 卢 布 而 言 却 有 些 残 忍 了 . 2007 年 访问 中 国 期 间 , 他 不 
幸 染 上 流感 ,并 使 用 了 抗生素 . 回国 后 ,他 感觉 非常 不 好 ,特别 是 腿 非 常 疼 . 诊断 结果 居然 
是 白血病 ! 尽管 医生 说 他 至 少 还 能 活 半年 以 上 ,可 是 他 的 健康 却 开始 急剧 恶化 ,三 天 后 
的 早晨 ,一 代 巨 壁 驾 稚 西 游 .或许 他 是 去 另 一 个 “平行 宇宙 ”里 ,延续 他 对 算 阵 的 热情 ,并 
继续 为 同事 和 后 学 提供 饮食 起 居 , 和 他 们 高 谈 阔 论 .交流 学 术 . 合 撰文 章 和 书籍 ……. 

亲爱 的 读者 ,请 暂时 低下 你 充满 智慧 的 头颅 ,向 这 位 伟大 的 学 者 致敬 吧 . 
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4. 6 ”矩阵 的 标准 型 


4. 6.1 实 正规 矩阵 在 正 交 相似 下 的 标准 型 


我 们 知道 ,任意 复方 阵 4 可 通过 本 矩阵 辟 西 相似 于 上 三 角 阵 工 当 A 特殊 为 实 矩 阵 
时 ,我 们 自然 希望 U 特殊 为 正 交 和 矩阵 V, 同时 了 工 也 特殊 成 实 上 三 角 矩 阵 . 显然 ,这 个 要 求 
难以 满足 ,因为 即使 是 实 抢 阵 , 也 可 能 有 复 特 征 值 . 看 来 在 保证 正 交 和 矩阵 V 的 同时 ,只 能 
放宽 对 了 的 要 求 . 注意 到 复 特 征 值 =“ 士 皮 是 以 共 斩 形式 成 对 出 现 的 ,而 1 一“ 士 皮 是 


矩阵 S = (《 ““) 的 特征 值 ,因此 合理 的 铺 测 是 将 了 放宽 为 准 上 三 角 短 隆 (quasi-upper 


triangle matrix, 也 称 拟 上 三 角 和 矩阵 ) , 即 实 和 矩阵 是 对 角 线 上 具有 1 X 1 阶 的 实数 和 2X2 
阶 的 子 矩阵 $ 的 块 上 三 角 和 矩阵 . 
定理 4.6.1 ( 实 Schur 标准 型 ) 若 A 是 实 方 阵 , 则 存在 正 交 和 矩阵 V 使 得 
VIAY = VAV = Th (4..6, 1) 


其 中 , Ts 是 准 上 三 角 和 矩阵, 并 且 和 矩阵 4 的 特征 值 就 是 矩阵 Ta 的 对 角 块 的 特征 值 , 即 每 个 
1 X 1 阶 对 角 块 对 应 一 个 特征 值 ,每 个 2 x 2 阶 对 角 块 对 应 于 一 对 复 共 轿 复 特征 值 . 
证 明 : 同 Schur 引 理 的 证 明 一 样 ,使 用 归纳 法 . 
设 4 是 4 的 一 个 特征 值 . 若 是 实 的 , 则 它 对 应 一 个 实 单位 特征 向 量 m , 将 m 扩充 为 
正 交 矩阵 同 二 (mm , 太 )， 故 hm 二 Vin 一，VThm 一 和 古 一 0, 记 AP 一 wo， 
VIA4V 一 A1, 则 


本 
gl Al a 


ViAV' A ,V1) = 


0 A 


VT 
由 归纳 假设 ,存在 n 一 1 阶 正 交 和 矩阵 V, 和 准 上 三 角 和 矩阵 工 , 使 得 VIA1V, = 今 V== 


1 1 1 1 A QV 


Al 人 


YI4V = ViAVi 一 一 三 了 


Vi 


V, Vi 0 A V 0 a 
显然 , gaV; 是 1X (n 一 1) 阶 矩 阵 ,因此 T 是 准 上 三 角 和 矩阵 . 
车 4 是 复 的 , 则 它 对 应 一 个 复 单位 特征 向 量 vi, 即 hr 一 wi, 同时 Ay1 = 4 一 


和 而 二 入 访 ， 即 (hi ,Vi ) 也 是 A 的 特征 对 . 取 Ll 的 实 部 Ve’ 一 去 tw 十 V1》 和 虚 部 Wr == 序 C 
一 由)， 则 spanCyr ,V1) 二 span(Cm ,mi ) 是 一 个 2 维 不 变 子 空间 . 令 凤 = (mw), 其 QR 分 
解 为 Vi 二 ViR, 则 span(V1) = span(vr ,v1) 是 不 变 的 子 空间 , 即 存在 2 阶 矩 阵 $, 使 得 
4V 二 ViS, 也 就 是 Yi4V = $. 扩充 nX2 阶 矩 阵 同 为 正 交 和 矩阵 站 一 (Vi,V,), 则 
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VIAVi = 二 VIViS = 二 0. 记 VIiAV; 一 A, 故 
VT S VIiAV, 


VT4V = A(Vi,V;) 一 


VI AA: 
同样 ,由 归纳 假设 ,存在 一 2 阶 正 交 和 矩阵 Y 和 准 上 三 角 和 矩阵 T', 使 得 VTA1Vs 一 


T. 记 V = 二 Vdiag(J,V), 易 证 V 是 正 交 和 矩 阵 , 则 


| L (天 S VIiAV,)| [L, 
VTiAV= VIiAV ss , , 
VT Vs Ver)JlO Ai Vs 
S VIiAV,V’ 
= = 三 了 
O T 


其 中 , 矩 了 泗 ViAVzV 为 2X (n 一 2) 阶 和 矩阵 ,因此 T 是 准 上 三 角 和 矩阵 . 证 毕 . 

当 实 方 阵 4 特殊 为 实 正规 矩阵 时 ,根据 正规 矩阵 的 经 验 , 我 们 自然 猜测 准 上 三 角 矩 
阵 Ta 也 应 该 特殊 为 准 对 角 和 矩阵 (quasirdiagonal matrix, 也 称 拟 对 角 和 矩阵 ) , 即 对 角 线 上 有 具 
有 1X1 阶 的 实数 和 2X2 阶 的 子 矩阵 $ 的 块 对 角 和 矩阵 . 

定理 4.6.2 ( 实 正 规矩 阵 的 正 交 相似 标准 型 ) 若 对 阶 实 方 阵 4 有 zp 对 复 共 斩 特 征 值 
a 士 bri 和 和 2 个 实 特征 值 M) (8 二 1,2,…,p;j 二 2p 十 1,2p 十 2,…,2p 十 m 且 2p 十 mm 二 
n), 则 A 是 实 正 规矩 阵 的 充 要 条 件 是 存在 正 交 矩阵 V 使 得 


VIiAV 三 二 ViAV 二 一 An = diag(S， , 9， sy ) 人 2pHl ， 人 2pH2 Pp ) (4. 6. 2) 


CA 3 Db 


其 中 , S， = 


总 

我 们 称 式 (4. 6. 2) 为 实 正规 矩阵 4 的 正 交 相似 标准 型 . 

在 证 明 这 个 定理 之 前 ,我 们 先 给 出 一 个 引 理 . 

引 理 4.6.1 设 A 是 特征 值 为 4a 土 & 的 二 阶 实 和 矩阵, 则 A 是 实 正规 矩阵 的 充 要 条 件 
是 存在 二 阶 正 交 炬 阵 V, 使 得 V7AV 一 VAV = 5, 其 中 $= (一 外 

证 明 : 充 分 性 . 由 于 S'S 二 SST, 故 

AT™A = (VSVYT)T(VSVT) = VSTSVT 一 VSSTVT = (VSVT) (VSV™)T = AAT 
必要 性 . 因为 4 是 实 正 规矩 阵 ,因此 存在 二 阶 西 矩 阵 U = 二 (wi ,ws)，, 使 得 
UTAU = UAU = diag(a + bi,a— Hi) 

这 里 (a 十 如 ,tw ) 和 (a 一 Bi ,ws) 是 矩阵 A 的 特征 对 ,有 征 ws = ui. 


售 Y = (my )， 其 中 Vi = 着 甸 十 zz),y 一 也 他 一 zz)， 显然 Y 是 实 和 矩阵 , 记 


二 则 V = 二 UP, 因此 Vay = PaUnUP = pHp 二 1, 即 站 是 正 交 矩阵. 注 
1 
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1 1 
二 (hui 十 Au;) 二 二 
V2 


= QV 一 pv ,Av;» = bvi 十 avs 


Av| 一 [Cai+6) wt (a— Bb) wu,] 


则 VITAV 二 ViAlvi,ww) 一 VTOmm)S 一 VIVS = S. 证 毕 . 

定理 4. 6. 2 的 证 明 : 充 分 性 是 显然 的 . 

必要 性 . A 是 实 正规 矩阵 ,根据 定理 4. 6. 1, 存 在 正 交 和 矩阵 Vi 和 准 上 三 角 实 和 矩阵 Th， 
使 得 
Ti Ts 
VIAVi = ViiAV = T= 


O T, 


其 中 了 > 是 对 角 元 为 Azpt1 ， 人 2p2 AAA2pHm 的 上 三 角 和 矩阵 ， Ti 是 对 角 线 上 全 为 二 阶 矩 阵 的 
准 上 三 角 和 矩阵 , 即 


Sl Si Sip 
SS as S,, 

Th = E (4. 6. 3) 
Spp 


这 里 的 Si 是 特征 值 为 a. 十 bei 《太一 1。2， 万 ) 的 二 阶 实 和 矩阵 . 
因为 A 是 实 正规 矩阵 , 易 证 了 也 是 实 正规 矩阵 , 即 TIT = TTT, 因此 


Th OT Ts， Ty To O 


Ti T2, O 了 > 2 O 了 > Ti Ti 


也 就 是 
Th Tn = Tu Th 十 Tis TY ,Th Ti = Ti, T2, 
TeT = TTh ,Th Ts Th Tz = Ts Th (4. 6. 4) 
由 于 tr(THT1) 二 tr(ThTh), 故 由 式 (4. 6.4) 中 的 第 一 式 可 知 tr(TisT%) = 二 0. 对 任 
意 和 矩阵 B, 直接 计算 可 知 trCBB') 是 B 的 所 有 元 素 的 平方 和 ,因此 Ts ==O, 代入 式 (4.6.4) 
中 ,得 THT = Tu Th ? T3, T»» 人 T22T2 ， 这 说 明 Ti，T2> 均 为 实 正规 矩阵 . 再 根据 引 理 
4.1.1, 可 知 Tzs 是 对 角 和 矩阵 , 即 
T2 一 diag(hAzoH 9 人 A2pH2 9 °° yA2phm) 
由 于 TIT = 二 Tn78, 将 式 (4.6.3) 代入 ,可 得 p 个 等 式 


SS 二 SST 二 SisSb 十 SS 
SizSt 十 S2S2 全 S252, 十 S23SE es 十 SSJ, 


Si,S1, 十 SS Sh,S,, = Sy,SY, 


(4. 6. 5) 
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同 前 面 一 样 ,对 式 (4. 6. 5) 的 第 一 式 两 边 求 矩 阵 的 迹 ,并 注意 到 tr(SHS11) 二 tr(SuS1) 
以 及 trCSuS1) 是 矩阵 Su 的 所 有 元 素 的 平方 和 ,可 得 Su 一 OCR 一 2,3，… 力 ). 将 SS 一 O 
代入 式 (4. 6. 5) 的 第 二 式 , 并 按照 类 似 的 证 明 手 法 ,可 知 sx 二 O (二 3,4,…,p ). 继续 
这 个 过 程 , 最 终 可 得 
S; 一 OO (i = 工 32 9 起 起 
因此 式 (4. 6. 3) 中 的 Th 是 拟 对 角 和 矩阵 , 即 Ti diag(Si1l ,S22 ye 9 )， 从 而 
ViAV, = ViiAVi 二 T= diag(Si1 ,22 本 Spp »A2pt1 »A2pt2 和 sAaptm) 

根据 引 理 4. 6. 1, 对 任意 Sx ， 都 存在 二 阶 正 交 和 矩阵 V&, 使 得 V&SuVu 一 S (k= 二 1， 

yi » 仿 - 
V 一 Vidiag (Vi » V2 ss Vpp »,T,) 

验算 易 知 式 (4. 6. 2) 成 立 . 证 毕 . 

对 特殊 的 实 正规 矩阵 ,标准 型 更 特殊 ,例如 : 

(1) 正 交 和 矩阵 4〈 在 正 交 相似 Y 下 ) 的 标准 型 为 


ViAV 一 ViAV 5 diag(S1 ,S» ys ly 1s = ] es > 1) 


cosOs sinO. 


其 中 , S, 一 是 二 阶 Givens 矩阵 G( 一 0) (有 一 1,2,…,p). 


一 Sin0， cos 和 
(2) 实 对 称 和 矩阵 4 的 标准 型 是 实 对 角 和 矩阵 4A, 即 VI4YV 二 VAV 一 人 . 
(3) 反 对 称 和 矩阵 4 的 标准 型 为 


ViIAV=V iAV 一 diag(S ,SS 1 1 一 1 一 1) 


其 中 ， S; = | +b 为 矩阵 A 的 特征 值 (k 二 1,2,…,p ). 
在 Matlab 中 , 当 和 矩阵 4 是 实 和 矩阵 时 ,调用 格式 


[VU,T]= schur (A, 'real') 
及 其 缺 省 形式 
[VU,T]= schur (A) 

返回 的 就 是 实 Schur 标准 型 . 
4.6.2 各 种 矩阵 标准 型 之 间 的 关系 

到 目前 为 止 , 我 们 已 学 习 了 很 多 标准 型 ,它们 基本 上 可 归结 为 “对 何 种 矩阵 采用 何 种 
变换 得 到 何 种 标准 型 ” 一 般 来 说 ,采用 的 变换 越 特 殊 , 得 到 的 标准 型 越 一 般 , 同 时 适用 的 
矩阵 也 越 特殊 . 毕竟 “ 鱼 与 能 掌 不 可 兼 得 ”以 此 为 视角 ,可 用 图 4- 17 来 表示 这 些 标准 型 
之 间 的 关系 . 

在 图 4- 17 中 ,有 些 标准 型 是 以 分 解 的 名 义 给 出 的 ,例如 UTAU 一 工 实际 上 等 价 于 
Schur 分解 4 = 二 UTU7!, 前 者 强调 所 用 的 变换 及 得 到 的 结果 ,后 者 则 强调 其 运算 意义 . 
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奇异 值 分 解 
UAV=3 


标准 型 分 解 
RAC=N 


(a) 


(f) 


Hermite 标准 型 
RA=H 


(g) 


行 最 简 型 
RA=U 
合同 标准 型 
PAP=A 
(e) 


实 对 称 和 矩阵 的 谱 分 解 
CO-4O = 人 


(i) 
Schur 分 解 
UAU=T 
(j) 


正规 矩阵 的 谱 分 解 
UAU=A 


实 正规 矩阵 在 正 交 相似 下 的 标准 型 
ViAV= A, 


图 4-17 各 种 矩阵 标准 型 的 关系 图 


在 图 4-17 中 , (a) 意味 着 A 特殊 为 方 阵 时 ,和 矩阵 R,C 特殊 为 C = P,R 二 C71, 同时 
作为 平衡 的 代价 ,标准 型 N 就 被 放宽 为 更 一 般 的 Jordan 矩阵 J; (b) 意味 着 J 特殊 为 对 
角 阵 A 未 必 是 实 对 角 和 矩阵 ) 时 ,适用 和 矩阵 必须 特殊 为 可 对 角 化 矩阵 A;(c) 大 家 非常 熟 
悉 , 可 北 矩阵 了 特殊 为 正 交 和 矩阵 0Q; (d) 是 限定 C= 二 P,R 二 Ci; (e) 要 求 P' 二 Pi; (CD 意 
味 着 只 采用 行 初等 变换 , 即 C = I; (g) 意味 着 将 行 阶梯 矩阵 Ha 化 成 了 更 特殊 的 行 最 简 
和 矩阵 Ua; (h) 将 矩阵 R,C 特殊 为 本 矩阵 DU,YV, 代价 是 标准 型 N 一般 化 为 瑟 ; (i) 限定 A 为 
方 阵 且 U,V 互 逆 , 代 价 是 允 变 成 了 更 一 般 的 上 三 角 和 矩阵 T; 0Gj) 意味 着 工 特殊 为 对 角 阵 人 
时 ,适用 和 矩阵 必须 特殊 为 正规 矩阵 A;〈(k) 将 西 矩 阵 U 特殊 为 正 交 和 矩阵 ,同时 4 特殊 为 实 
正规 矩阵 ,代价 则 是 对 角 阵 A 变 成 了 更 一 般 的 准 对 角 和 矩阵 44; (1) 表示 实 正规 矩阵 4 特 
殊 为 实 对 称 矩 阵 时 , 准 对 角 和 矩阵 As 特殊 为 实 对 角 和 矩阵 4; (m) 则 是 可 逆 矩 阵 王 特殊 为 酉 和 矩 
阵 U, 代价 是 Jordan 矩阵 J 一 般 化 为 上 三 角 和 矩阵 T; (n) 也 是 可 逆 和 矩阵 己 特殊 为 本 矩阵 D; 
(0) 表示 4 特殊 为 实 和 矩阵 ,代价 是 上 三 角 和 矩阵 工 变 成 了 更 一 般 的 准 上 三 角 和 矩阵 及; (p) 则 是 
实 和 矩阵 A 特殊 为 实 正规 矩阵 ,因此 准 上 三 角 抑 阵 T 自然 也 特殊 为 准 对 角 和 矩阵 AA. 

另外 ,出 于 美观 ,我 们 也 略 去 了 一 些 分 解 ,比如 QR 分 解 4 = QR 就 等 价 于 QT7A = R， 
这 可 以 看 成 是 从 行 最 简 型 RA = U4 衍生 出 来 的 ,实在 不 行 就 从 标准 型 分 解 RAC 二 N 这 
个 源头 出 发 , 即 限定 A 为 方 阵 且 R== 0 ,C= 二 了 代价 是 标准 型 NN 被 放宽 为 更 一 般 的 单位 上 
三 角 和 矩阵 R. 再 比如 LU 分 解 A 二 LU, 也 就 是 LAU 一 开 即 限定 R==L',C=U. 

在 图 4- 17 中 我 们 也 不 难 发 现 ,最 常用 的 和 矩阵 标准 型 无 非 是 对 角 和 矩阵 .Jordan 矩阵 
和 上 三 角 和 矩阵 等 . 不 过 我 们 千 万 不 要 被 这 个 假象 所 迷惑 ,因为 标准 型 作为 零 元 素 比 较 多 
的 稀 牙 矩阵 ,其 非 零 元 素 的 位 置 及 取 值 也 千差万别 . 她 们 或 端庄 凝重 ,或 清新 活泼 ,或 温 
婉 可 人 ,或 妖娆 多 态 ,共同 构 成 了 矩阵 大 花园 巡 紫 嫣红 的 瑰丽 景观 . 这 就 是 说 ,除了 上 面 
已 介绍 的 这 些 之 外 ,还 有 许 许多 多 “刻苦 惊 鸿 , 婉 若 游 龙 ” 的 标准 型 ,她 们 也 “华容 娴 娜 , 令 
我 忘 餐 ” 比如 三 对 角 和 矩阵 .Heisenberg 矩阵 ,以 及 矩阵 C 的 特征 多 项 式 

20 一 | 虹 一 C| 王 如一 加- 有 一 … 一 加 一 加 一 0 
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对 应 的 友和 矩阵 或 Frobenius 标准 型 C= 二 Cl 或 C= Cs, 其 中 


0 1 pr prz ph to 如 
0 1 0 nh 
= l 或 1 ,CC 
0 1 0 ps 
bo nh brz pr 1 0 1 pa 


大 人 


在 控制 理论 中 , Ci 称 为 可 控 标 准 型 , C; 则 称 为 可 观 标准 型 . 要 提醒 读者 的 是 , 面 对 这 
些 " 动 无 常 则 , 进 止 难 期 ”的 标准 型 ,请 不 要 就 此 “ 夜 耿耿 而 不 襟 ”因为 标准 型 的 美丽 后 面 


习 题 四 


若 (XA,x) 是 正规 矩阵 A 的 特征 对 , 则 (1,x) 是 正规 矩阵 AH 的 特征 对 . 

证 明定 理 4. 1. 6. 

设 和 A,B 均 为 n 阶 正规 短 阵 且 AB 一 BA，, 则 对 任意 正 整 数 上 ,l, 证 明 44 了:，B44: 均 为 
正规 矩阵 . 

设 4 为 正规 矩阵 , 则 对 任意 复数 z,w，, zxA 十 thAa 必 为 正规 矩阵 . 

设 A 为 正规 矩阵 , 则 A 一 姬 也 是 正规 矩阵 . 

设 和 为 n 阶 正规 矩阵 , 则 存在 n 阶 西 矩 阵 U, 使 得 UNAU 和 UNANU 都 是 对 角 和 矩阵 ， 
即 和 A 和 A 可 以 同时 西 对 角 化 . 

设 4 为 正规 矩阵 且 4 二 A?, 则 A 二 AT. 

设 复方 阵 和 A 的 Cartesian 分 解 为 A 二 B 十 iC, 则 人 和 是 正规 矩阵 的 充 要 条 件 是 Her- 
mite 矩阵 了 召 ,C 可 交换 , 即 BC 一 CB. 

n 阶 复 矩 阵 和 是 正规 给 阵 的 充 要 条 件 是 存在 正规 给 阵 B, 使 得 陕 一 A, 其 中 是 任意 
正 整数 . 

0 一 1 i 
:人 加 
i 0 0 
证 明 Hermite 短 阵 和 的 整数 次 寺 人 4 仍然 是 Hermite 给 阵 , 其 中 整数 有 为 负 整 数 时 
假定 矩阵 A 可逆. 

已 知 Hermite 短 阵 A,B, 则 对 任意 实数 a,b, 天 阵 C= 二 ah 十 女人 仍然 是 Hermite 矩阵 . 
已 知 给 阵 A、B 是 Hermite 矩阵, 则 AB 也 是 Hermite 矩阵 的 充 要 条 件 是 AB == BA. 
设 A、B 都 是 Hermite 矩阵 , 则 人 与 召 相 似 的 充 要 条 件 是 它们 的 特征 多 项 式 相同 . 
证 明 A 是 Hermite 答 阵 的 充 要 条 件 是 对 任意 YE  C",xHA4x 是 实数 ， 

设 丁 答 阵 U 的 特征 值 不 等 于 一 1, 则 短 阵 TU 可逆, 且 百 一 iT[ 一 0D) (I 十 U) 站 是 
Hermite 矩阵 .反之 , 若 百 是 Hermite 答 阵 , 则 答 阵 工 一 光 可 逆 , 且 U 二 (I 十 iH) 


求 正 规矩 阵 A 一 的 谱 分 解 表 达 式 . 
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(I 一 理 ) 是 西 矩 阵 . 
设 人 4 是 反 Hermite 短 阵 , 则 芽 LA 都 可 逆 , 且 C 王 (CT 一 4) (I 十 A) 是 特征 值 不 为 
一 1 的 相 瑜 阵 . 
设 人 是 正 交手 阵 , 且 T 十 A 是 非 奇 异 的 , 则 人 可 表示 为 4 一 (I 一 S) (I 十 $S) 71, 其 
中 S 是 反对 称 和 矩阵 . 
设 A 是 n 阶 实 对 称 和 矩阵 , 且 42: 二 A, 则 存在 正 交 矩阵 O 和 整数 ,使 得 
0 1A0 = diag(L, ,0) 

设 A 是 n 阶 实 对 称 和 矩阵 , 且 42: 二 了, 则 存在 正 交 短 阵 O 和 整数 ,使 得 

QA40 = diag(L,, —1,,) 


设 AA 是 协 替 短 阵 ( 即 存在 正 闲 数 上 ,使 得 A 二 0O 〇 ) 且 A 是 Hermite 给 阵 , 则 A 二 0. 


I 0 2z 
求 Hermite 珑 阵 A 二 | 0 3 0 | 的 谱 分 解 . 
2 0 1 


设 AE C” 是 mXn 阶 列 满 秩 和 纶 阵 , 则 ANA 二 0. 

设 A 放 0, BE Co 是 Hermite 短 阵 , 则 4B 和 BA 的 特征 值 全 是 实数 . 

设 和 A 宇 0 且 A 和 是 西 矩 阵 , 则 A 一 I 

设 和 A 宇 0, 证明 : | 工 +4| 三 1, 并 且 等 号 成 立 的 充 要 条 件 是 A 二 0. 

设 A 是 Hermite 答 阵 , 则 存在 上 二 0, 使 得 4 十 左 僵 0 且 4 一 红 一 0. 

设 4 二 0, 有 二 0 且 4B 是 Hermite 给 阵 , 证 明 4B 二 0. 

证 明 Hilbert 和 矩阵 百 二 0. 

证 明 西 空间 ( 欧 氏 空间 ) Y 中 满足 P? = 二 也 的 线性 变换 万 为 投影 变换 ， 

设 卫 是 投影 矩阵 ,证 明 工 一 已 也 是 投影 矩阵 ,并 从 变换 角度 加 以 解释 . 

设 P 是 投影 矩阵 ,证 明 并 从 变换 角度 解释 P(I 一 P) = (I 一 P)P= 二 0. 

设 P 了 是 n 阶 投影 矩阵 ,证 明 N(P) 二 RCI 一 P), N(I 一 P) 一 RCP) 以 及 Cn 一 RCPD) 
NP). 

证 明 投影 矩阵 的 特征 值 只 取 1 和 0 两 个 数值 ,并 举例 说 明 反 之 未 必 成 立 . 

设 P 是 n 阶 正 交 投影 矩阵 ,证 明 C" = 二 R(P) @ N(P). 

证 明 式 (4. 1. 8) 中 的 给 阵 G 是 正 交 投影 矩阵 . 据 此 ,你 对 谱 分 解 表 达 式 是 否 有 新 
的 认识 ? 

设 P,P 均 为 正 交 投影 矩阵 , 则 已 十 书 为 正 交 投影 矩阵 当 且 仅 当 PP' = 二 PP 二 0 

设 P,P 均 为 正 交 投影 矩阵 , 则 P 一 P 为 正 交 投影 矩阵 当 且 仅 当 PP’ 二 PP 二 P. 
设 P,P' 均 为 正 交 投影 矩阵 , 且 PP' 一 PP, 则 PP' 也 是 正 交 投影 矩阵 . 

求 矩 阵 4 的 完全 SVD 和 约 化 SVD, 其 中 A 为 : 


i 1 0 1 名 2 0 本 
(DIo 1 olc)lolil;ic)li 2|; 4) lo 一 让 1， 四 
1 0 一] 1 1 本 村 GO © 


证 明 可 北方 阵 的 行列 式 的 绝对 值 为 其 奇异 值 之 积 . 
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4.42 ” (奇异 值 丁 不 变 ) 设 AE Cox 且 UV 分 别 是 m,n 阶 丁 矩阵 , 则 称 B 二 UAV 与 4 本 
等 价 . 证 明和 4A 与 B 的 奇异 值 相同 . 它们 的 奇异 向 量 有 何 关 系 ? 

4.43 已 知 BB 二 全 人 ), 关 4AE Ce ,证 明 入 的 奇异 值 就 是 电 的 特征 值 的 绝对 值 . 

4. 44 ”( 极 分 解 ) 对 任意 nn 阶 复 和 矩阵 和 A, 硝 在 酉 矩阵 U 和 B 宇 0,C 宇 0, 使 得 A 二 BU = 


UC, 且 
及 = AA™,C’= A8A 


范 数 的 英文 是 norm, 其 形容 词 normal, 在 数学 中 被 译 成 正规 ( 抢 阵 ) 、 正 态 ( 分 布 ) 法 
(方程 .向 量 ) 和 标准 ( 正 交 基 ). 这 些 译 法 尽管 语义 上 略 有 歧 异 ,但 显然 都 能 让 人 联想 到 
《尚书 。 洪 范 》, 这 里 “ 洪 ? 即 “大 ”， 范 ? 即 “ 法 ”该 书 相传 是 簧 子 向 周 武王 陈述 的 九 种 根本 
性 的 治国 大 法 ,对 后 人 影响 极 大 . 在 数学 里 , 范 数 是 向 量 到 实数 的 一 种 映射 (函数 ), 对 向 
量 这 个 兼 具 大 小 与 方向 即 数 与 形 的 数学 对 象 , 范 数 度量 的 是 向 量 的 大 小 , 即 向 量 数 的 一 
面 ,在 数学 中 意义 深远 . 以 此 观 之 , 深 说 个 中 三 昧 的 先辈 选择 了 “ 范 数 ”这 个 译名 , 可谓 贴 
切 之 极 矣 . 


_5. 1 向量 范 数 


5.1.1 从 绝对 值 及 模 说 起 


我 们 从 实数 的 绝对 值 .复数 的 模 以 及 向 量 的 长 度 说 起 . 鉴于 我 们 考虑 的 是 线性 空间 ， 
因此 我 们 仍 把 目光 聚焦 于 加 法 和 数 乘 运 算 , 以 揭示 反映 它们 本 质 的 性 质 . 

例 5.1.1 实数 a € R 的 绝对 值 指 的 是 量 数 |a| = asgn(a), 它 具 有 下 列 三 条 
性 质 : 
(1)la| 宇 0, 当 且 仅 当 a = 0 时 ,等 号 成 立 ; 
(2) 对 任意 的 A+€ 民 , 成 立 |Xa| 二 |4|1al; 
(3) 对 任意 的 a,b5 € R, 都 有 |a+o 委 |a| 十 |2|， 
例 5.1.2 复数 z= (a,0) = 二 a.1 十 biE€ C 的 长 度 或 模 指 的 是 量 |z| 一 Vaz 十 多 ， 
它 也 具有 下 列 三 条 性 质 : 

(1)|z| 宇 0, 当 且 仅 当 z= 二 0 时 ,等 号 成 立 ; 

(2) 对 任意 的 ME 民 , 成立 |4z|= 二 |4| |z|; 

(3) 对 任意 的 zi ,zs € C, 都 有 |zi 十 zz| 志 |zi | 十 |zz|. 

对 于 实数 和 复数 ,由 于 定义 了 它们 的 绝对 值 或 模 , 这 样 我 们 就 可 以 用 这 个 度量 来 表 
示 它 们 的 大 小 (几何 上 就 是 长 度 ) ,进而 可 以 考察 两 个 实数 或 复数 的 距离 . 

例 5.1.3 7 维 欧 氏 空间 R” 中 向 量 x = (zi ,zs,…zx) EE€ 民 ” 的 长 度 或 范 数 定 
义 为 
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上 | 二 YC) 二 过 十 强 十 二 十 肛 


显然 ,向 量 x 的 长 度 |xl| 也 具有 下 列 三 条 性 质 : 

(1) |x| 宇 0, 当 且 仅 当 x 二 0 时 ,等 号 成 立 ; 

(2) 对 任意 的 +€ ,成 立 |ax|==|4lxl; 

(3) 对 任意 的 x,y € R", 都 有 | x 十 y| 三 |x| 十 yl 

利用 公理 化 的 方法 ,可 以 把 上 述 概念 推广 到 数 域 FCF= R 或 f= C ) 上 的 任意 线性 
空间 . 

定义 5.1.1 ( 范 数 的 定义 ) 设立 是 数 域 了 上 的 线性 空间 ,对 任意 向 量 wE V, 按照 某 
种 对 应 规则 ,都 有 一 个 非 负 实数 f(@) 与 之 对 应 ,并 且 对 任意 &E 下 及 任意 ,BEV, f(a) 
都 满足 下 列 三 个 性 质 : 

(1)〔 正 定性 ) Fo) 三 0; 当 目 仅 当 x 二 0 时 , f(a) = 0; 

(2) ( 正 齐 性 ) f (ka) = |k|f(@); 

(3) (三 角 不 等 式 ) f(c 十 有 ) 妥 Fa) 十 FB)， 
则 称 /ae) 是 向 量 @ 的 范 数 Cnorm) ,并 称 定义 了 范 数 的 线性 空间 V 为 赋 范 线性 空间 
Cnormed linear space). 

注意 : 范 数 f(a) 本 质 上 是 VR 的 映射 ,并 且 满 足 上 述 三 个 性 质 . 考虑 到 直观 性 ,一 
般 更 喜欢 用 与 绝对 值 符号 | .| 相似 的 记号 |ex| 来 表示 w 的 范 数 , 即 f(a) = |e|. 

思考 : 范 数 是 线性 空间 V 上 的 线性 泛 函 吗 ? 

例 5.1.4 设 V 是 F 上 的 内 积 空 间 , 则 由 上 eal 二 Vla,@) 定义 的 外 .| 是 V 上 的 范 
数 , 称 为 内 积 (.") 的 导出 范 数 (induced norm). 这 说 明 范 数 未 必 都 可 由 内 积 导 出 . 例如 后 
面 介绍 的 外 |。 和 |. 小 . 因此 内 积 空间 是 特殊 的 赋 范 线性 空间 . 

例 5.1.5 在 赋 范 线性 空间 V 中 ,定义 任意 两 向 量 @,pB EV 之 间 的 距离 为 

d(a,P) 一 cx 一 有 Co. Ty 

并 称 此 距离 da(.,，) 为 V 由 范 数 .| 导出 的 距离 . 

易 证 按 式 (5. 1. 1) 定义 了 距离 的 V 满足 下 面 的 三 条 性 质 : 

(1) (对 称 性 ) 对 任意 ,BE V, 都 有 d(a,p) = d(p,@); 

(2)〈 非 负 性 ) 对 任意 a,B EV, 都 有 dla,P) 三 0; 当 生 仅 当 @ = 时 等 号 成 立 ; 

(3) (三 角 不 等 式 ) 对 任意 @,pB,Y EV, 都 有 dla,7Y) 去 de, 有 ) 十 CCB,7). 


5.1.2 常用 的 向 量 范 数 


下 面 我 们 把 目光 聚集 到 常用 的 向 量 范 数 ,毕竟 它们 是 应 用 中 的 主角 . 
例 5. 1.6 对 任意 x 一 《2 € {Os 由 


Ixls=vVizl Tiz | 二 …T |x, 1 = xix (5. 1. 2) 
定义 的 |xl; 是 C" 上 的 向 量 范 数 , 称 为 向 量 x 的 2 范 数 或 1, 范 数 ,也 称 为 Euclid 


范 数 . 
显然 式 (5. 1. 2) 可 形式 地 推广 到 任意 正 实数 p. 
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例 5.1.7 对 任意 x = (zi,zz)… ,Xi)' EE C", 当 p 宇 1 时 ,由 
|xl,=(| zi? 十 |zxz1? 十 十 | x, | 2?) (5. 1. 3) 


定义 的 上 xl, 是 C”" 上 的 向 量 范 数 , 称 为 向 量 x 的 p 范 数 ,也 称 为 i 范 数 或 Holder 范 数 . 
特别 地 , 当 | 时 ,由 
Tx 二 |zi| 十 |xz | 十 … 十 | 


定义 的 向 量 范 数 x 称 为 向 量 x 的 1 范 数 ,也 称 和 
范 数 或 和 范 数 . 

上 xl 更 被 风趣 地 称 为 Manhattan 范 数 . 你 只 要 
看 一 眼 纽约 曼哈顿 地 区 的 地 图 ( 见 图 5 - 1) ,就 能 对 
| zl 有 个 直观 的 形象 . 事实 上 ,为 了 直观 化 抽象 的 
数学 ,从 而 在 数学 中 引入 形象 思维 ,从 古 至 今 的 数 
学 家 们 可 真是 没 少 费 心思 . 比如 方程 的 根 (root) 就 ， & 
来 源 于 花 拉 子 米 (al-Khwarizmi, 约 783 一 约 850, 阿 
拉 伯 数学 家 ,最 早 把 方程 作为 研究 的 对 象 ,被 誉 为 
代数 学 之 父 ) ,因为 他 把 未 知 量 形象 地 称 为 dirhem、 
“东西 ”或 “(植物 的 ) 根 ”, 这 使 得 代数 当时 被 称 为 
“ 求 根 术 ”他 还 贡献 了 “算法 ”(algorithm) 和 “代数 | 
学 ”(algebra) 这 两 个 最 基本 的 数学 术语 . 又 比如 “ 欧 氏 空间 ”这 一 名 词 就 源 于 施 密 特 在 函 
数 空 间 中 引入 的 大 量 欧 氏 几何 术语 . 事实 上 ,逻辑 思维 和 形象 思维 是 人 类 思维 的 双翼, 不 
可 偏颇 . 数学 教育 界 一 直 在 大 力 提倡 “ 合 情 推理 ”( 又 译 * 似 真 推理 ” ,希望 在 数学 中 大 力 
弘扬 归纳 、 类 比 、 一 般 化 .特殊 化 .想象 和 直觉 等 方法 ,从 而 将 “冰冷 的 美丽 ” 变 成 “火热 的 
思考 ” 

遗憾 的 是 , 当 0 二 pp 二 1 时 ,由 式 (5.1.3) 定义 的 映射 不 是 C" 上 的 范 数 . 因为 n= 二 2 
且 p 二 1/2 时 ,车 取 x== (1,0)",y 二 (0,1)7, 则 x)ys = Dy1yz =1, |x++yly =4， 
从 而 


| (5. 1. 4) 


ed 
1 bE # a a 
El i. East Harie 


pi 


| xt yl Ss xl 1/2 十 | yl 
在 广义 实数 (即将 “无 穷 ” 看 成 数 ) 范 围 内 , p 能 否 取 到 正 无 穷 大 呢 ? 
对 任意 二 (RD EE (py 可 “形式 地 ”定义 |xll, = lim lxl,. 显然 ， 
zl 满足 非 负 性 和 齐 次 性 ,并 且 对 任意 y (yi 本 各 (CC 有 


[zx 十 天 -一 maxlz; + yil < max| zi|+ max| yil 一 | xl。 二 117y1。 


因此 , | xl。 是 向 量 范 数 , 称 为 向 量 x 的 无 穷 范 数 (infinite norm) 或 w 范 数 ,也 称 /, 范 
数 . 问题 是 ,怎么 计算 无 穷 范 数 呢 ? 

我 们 需要 将 底数 | x11? 十 |zz1? 十 … 十 |z,1*“ 合 并 ”成 一 项 ,这 自然 让 我 们 想到 绝对 
值 最 大 的 分 量 . 令 |z; | = max| Zi|， 则 有 


|z;|* < jzil?* 十 |zxz1? 十 … 十 [zl?* nlz;|? 
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从 而 
[wzls+ |zlst [zl Cn |z,| 
注意 到 limn? 二 1, 因此 
pt 
lx|s= liml|xl, = |z;|= max|z;| (5. 1.5) 
ptm 1<i<n 
下 面 我 们 给 出 p 范 数 ( p 三 1 ) 的 证 明 . 为 此 ,我 们 需要 先 证 明 两 个 重要 的 不 等 式 . 
定理 5. 1. 1 (Holder 不 等 式 ) 设 实数 p 二 1， 4>1 且 汤 二 二 二 1, 并 设 x 二 


(Ce a ee eR Rs === (yiyyz yn) €E C", 则 
n nn 有 n 六 
Dziyi (Dzls)? (2) |y|2)? C5, 1. 6) 
i=1 i=1 i=1 


显然 p= 二 g 二 时 Holder 不 等 式 就 退化 为 Cauchy-Schwartz 不 等 式 . 
证 明 : 先 证 明 对 任意 非 负 实数 wx,u 总 有 


和 (5.1.7) 


构造 函数 一 xi 并 考虑 如 图 5 - 2 所 示 的 图 。。 
形 . 令 
业 


Si 三 | widu = .2,5, = | mau = 一 上 
0 p 0 g 


显然 ,由 图 2 可 知 S) 十 号 5 之 wv， 而 且 仅 当 人 
u” 时 等 号 成 立 , 因 此 式 (5. 1. 7) 得 证 . 


a 1 
PE al, [| 广 里 a 一 (151)i， 
| 


b= (> |y, |)*, 代 人 式 (5. 1.7) 并 化 简 ,得 


1 | 六 | 1 [xl 
zy < ws a? Ti pb ) 
因此 
2 和 工 者 加 
宇 z 科 四 (富士 遍 忆 | 一双 ( 方 十 喜 ) 
-B= ll a 
证 毕 . 


定理 5.1.2 (Minkowski 不 等 式 ) 设 x 一 (ziyzx2y*,T,) 人 Ty 二 (yn yayyy)T EE 
C", 则 对 任意 实数 p 三 1, 有 
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lat sla) +t ls (5. 1. 8) 
证 明 : 当 2 二 1 时 , 式 (5.1.8) 显然 成 立 . 当 p 二 1 时 , 令 g 二 p/(p 一 1), 则 
Datyl = ltyllatyl Ill 
< hl [二 
由 Holder 不 等 式 可 知 
Plallatyl? (Del) (Platnl) 


Zyl ztyl? SD |y)?)’ (Dz yt)’ 
i=1 i=1] i=1 


因此 
和 zols[( le A ll i 
也 就 是 
Daryl < Dlal)+ (Il) 
证 毕 . 


现在 我 们 可 以 轻松 地 证 明 | 上 x|,(p 三 1 ) 是 范 数 了 . 
证 明 : | xl; 满足 非 负 性 和 齐 次 性 是 显然 的 . 由 Minkowski 不 等 式 ,又 有 


|x+yls= (2 |zi y:|?)7 
i=1 
a (2 | 六 十 (之 |y:1?)* < x), + lyl, 


即 三 角 不 等 式 也 成 立 . 因此 | xl 是 向 量 范 数 . 证 毕 . 
例 5.1.8 计算 向 量 x= (3, 一 4i,0,12)7 的 p 范 数 ,这 里 p= 1,2,o. 


解 : |z|,， 二 ll= [13+ |—4|+112|=19 


lz = (2 a) = /TT TAT T1207 ~— 13 
1 xl = max | zx | = max(3,4,12) = 12 
在 Matlab 中 ,提供 了 内 置 函 数 norm, 可 用 于 计算 向 量 x 的 范 数 ,其 中 2 范 数 .1 范 
数 .无 穷 范 数 和 范 数 的 调用 格式 分 别 为 


norm(x),norm(x,1),norm(x,inf),norm(x,p) 
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显然 , 缺 省 的 是 2 范 数 . 

上 面 这 些 向 量 范 数 在 几何 上 如 何 理解 呢 ? 

对 任意 x = (ziyz) E C?, 其 2 范 数 闲 单位 圆 |xl: 之 1 即 为 zf 十 zx 之 1,1 范 数 
闭 单位 圆 | xl， 三 1 即 为 [zi | 十 | zz| 委 1, o 范 数 闭 单位 圆 |xl,< 1 即 为 | 二 | 和 1， 
|zz | 三 1. 加 上 一 般 的 妃 范 数 ,向 量 x 的 闭 单位 圆 的 图 形 如 图 5 - 3 所 示 . 显然 许多 会 议 桌 
采用 的 就 是 最 后 一 个 图 形 . 


全 全 好 各 


5-3 二 维 向 量 的 几 种 范 数 的 几何 意义 


例 5.1.9 (椭圆 范 数 ) 若 复 和 矩阵 4 二 0, 则 对 任意 x € C", 由 
1 xl = Vx"Ax (5. 1. 9) 
定义 的 .ls 是 C" 上 的 向 量 范 数 , 称 为 向 量 x 的 加 权 范 数 (weighted norm) 或 椭圆 范 数 


(elliptic norm). 

证 明 : 当 x 一 0 时 , |xla 二 V0540 一 0; 当 x* 夫 0 时 ,由 4 之 0 可 知 xa4x 之 0, 即 
| xl > 0. 

对 任意 &E C,， 有 Rx|a = VCec)aACx) = |k| Vxaax = |xla. 

由 于 A > 0, 其 特征 值 为 正 实数 , 故 4 的 谱 分 解 为 4 = UAU" = UA . AiU" = 
Wr"W, 其 中 W = A2U" 为 可 道 矩 阵 , 此 时 

xl = vxiAx = Vx WiWx = VWx) Wx) = |Wx|, 
从 而 对 任意 y€E C", 有 
[|x+yla= IWe+ yl = wr +wyl, 


< lwrl:+lwyl; = |xla + lyla 


因此 式 (5. 1. 9) 定义 的 上 "| 是 C" 上 的 向 量 范 数 . 证 毕 . 
因为 | zl、 = Wx1|;, 从 几何 上 看 ,这 就 是 求 可 逆 线 性 变换 多 的 像 Wx 的 长 度 . 如 果 
三 一 diag(Cwlyw yw)， 此 时 所 求 即 为 


|xla = IWxls = Cwnl? dt |waz|’ tt | wr |?)2 
这 就 是 何以 这 种 范 数 被 称 为 加 权 范 数 或 椭圆 范 数 . 另外 ,上 面 的 推导 说 明 只 要 运算 Wx 
成 立即 可 ,因此 对 和 矩阵 W 的 要 求 可 放宽 为 列 满 秩 和 矩阵 . 


在 现代 控制 理论 中 , 称 二 次 型 函数 V(x) == |xl$ = xaPx 为 Lyapunov 函数 ,这 里 
卫 过 0. 众所周知 ,Lyapunov 函数 是 讨论 线性 和 非 线 性 系统 稳定 性 的 重要 工具 . 
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在 上 面 这 个 例子 中 ,我 们 用 2 范 数 定义 了 椭圆 范 数 ,这 说 明 可 以 从 已 知 范 数 构 
造 出 新 的 范 数 ,而 且 因为 正定 Hermite 矩阵 是 大 量 存在 的 ,这 就 极 大 地 扩展 了 范 数 的 
种 类 . 

例 5. 1. 10 (模式 识别 中 的 模式 分 类 问题 ) 模 式 分 类 问题 指 的 是 根据 已 知 类 型 属性 
的 观测 样本 的 模式 向 量 %，w，…，sw,， 判断 未 知 类 型 属性 的 模式 向 量 x = 
(zz 和 myz)TE C" 归属 于 哪 一 类 模式 . 其 基本 思想 是 根据 x 与 模式 样本 向 量 s; (j = 
1,2,…,M) 的 相似 度 大 小 作出 判断 . 

最 简单 的 方法 是 用 两 向 量 之 间 的 距离 来 表示 相似 度 ,距离 越 小 ,相似 度 越 大 . 最 典型 
的 是 欧 氏 (Euclidean) 距 离 , 即 对 任意 x = (ziyz2wn*,Xi)' EE C* 和 y= 二 (yyy yy,)T 
E C7, 定义 


d(x,y) = |x—yls = V(x— yx—y) = (2) ee 
j=1 
其 他 距离 测度 还 包括 : 
(1) 绝 对 值 距离 (Manhantan 距离 ) d(x,y) = 二 上 x 一 y 上 1 二 》) |zj 一 yj|; 
j=1 
(2) 切 氏 (Chebyshev) 距 离 d(x,y) = 二 上 x 一 y|。= max|z; 一 yj|; 
(3) 闵 氏 (Minkowski, 闵 科 夫 斯 基 ,1864 一 1909 ,德国 数学 家 , 爱 因 斯 坦 的 大 学 老师 和 
密友 ,提出 的 闵 氏 时 空 为 广义 相对 论 的 建立 提供 了 框架 ) 距 离 
dxsy) = |x—yl; = 071z —y "7 
j=1 
(4) 马 氏 (Mahalanobis, 马 哈 拉 诺 比 斯 ,1893 一 1972, 印度 统计 学 家 ) 距 离 
di(xsy) = |x—yl|s: = VC 一 JIS (x—y) 


这 里 , x,y 是 从 总 体 N (yp,S) 中 抽取 的 两 个 样本 . 如 果 x,y 来 自 两 个 数据 集 , 则 将 S 改 为 
互 协 方差 矩阵 C. 
对 于 函数 空间 C[La,2, 联想 到 其 标准 内 积 , 并 类 比 p 范 数 , 则 有 如 下 的 范 数 : 


例 5S.1.11 对 任意 f(D € Cla,], 由 1D1, = ( olrap (这 里 p 宇 1) 定 


义 的 .1 是 CLa,b] 上 的 范 数 , 称 为 函数 f(z) 的 工 , 范 数 . 
特别 地 , p 二 1,2,oo 时 的 二 范 数 、L; 范 数 和 工 。 范 数 分 别 为 


1h =| old 


| .Fo = (flr 1) 
|f02) |.= max | CD | 


更 一 般 地 ,借助 于 基 和 坐标 向 量 ,可 将 任意 线性 空间 V 中 的 范 数 转化 为 F" 上 的 向 量 
定理 5.1.3 设 V 是 数 域 Ff 上 的 线性 空间 , ol ,cz ，…,o, 为 V 的 一 组 基 , 任 意 m EV 
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在 这 组 基 下 的 坐标 向 量 为 x € 扩 , 则 
laly = lxl (5. 1. 10) 
是 V 上 的 向 量 范 数 ,其 中 |x| 为 F" 上 的 向 量 范 数 . 
证 明 : 对 任意 gc EV, 若 a 关 0, 则 x 关 0, 从 而 |alv = 上 xl 二 0; 若 == 90, 则 x= 
0, 从 而 |alv = | zl> 0. 
对 任意 有 EF, kx EV 的 坐标 向 量 为 kx，, 故 
lalv = lax|= |: |x|l= ||: laly 


设 任意 BPEV 在 基 @1 ,az ,oa 下 的 坐标 向 量 为 yE 严 , 则 x 十 有 的 坐标 向 量 为 x 十 
y， 从 而 


latply = lx+yl< 1xl+lyl= laly + lply 


因此 |alv 是 V 上 的 向 量 范 数 . 证 毕 . 
在 不 致 混淆 时 , |aly 常 略 写 为 Dal. 


5.1.3 向 量 范 数 的 几 个 性 质 


椭圆 范 数 中 ,如 果 W 取 特 殊 的 本 矩阵 也, 显然 此 时 4 王 工 从 而 xl|; = |xla = 
|Ux|;. 
定理 5. 1.4 (Euclid 范 数 的 本 不 变性 ) 对 任意 西 和 矩阵 UE C”™ 以 及 任意 x E€ 
C", 有 
IUx|; = |xl; (5.1. 11) 


证 明 : xl = (Ux,Ux) = (Ux) HUx) = xiUHUx = xax 一 | zl 证 毕 . 

从 变换 角度 看 ,这 个 结论 是 显然 的 ,因为 西 变换 保持 向 量 的 内 积 不 变 , 自然 也 保持 了 
Euclid 意义 下 的 几何 结构 (长 度 、 角 度 或 范 数 等 ) 不 变 . 

在 图 5-3 中 ,尽管 几 种 范 数 对 应 的 图 形 有 差异 ,但 它们 都 是 封闭 图 形 ,都 可 以 用 一 个 
圆心 在 原点 的 圆 (2 范 数 意 义 下 ) 来 覆盖 . 这 说 明 尽 管 各 种 范 数 大 小 不 同 ,但 作为 度量 用 的 
不 同 “ 尺 子 ”, 它 们 对 外 表现 出 明显 的 一 致 性 , 正 所 谓 “ 内 斗 外 和 ”. 这 种 性 质 就 是 范 数 的 等 
价 性 . 

定理 5. 1.5 (向 量 范 数 的 等 价 性 ) 有 限 维 线性 空间 V 上 的 不 同 范 数 是 等 价 的 , 即 对 
n 维 线性 空间 V 中 任意 w EV 及 V 上 的 任意 向 量 范 数 f 二 f(a) 和 g 二 g(@)，, 必 存 在 正 
数 C19C2， 使 得 


cg(CxX) 去 fa) 去 cg(Co) (5, 1, 12) 

证 明 : 先 证 明 等 价 性 是 可 传递 的 . 设 w(a) 也 为 VV 上 的 向 量 范 数 ,并 且 存 在 正 数 c1 ,c% 

及 df, 咏 ,使 得 cip(a) 用 Fo) <ewpla), dg lo) < op(o) < cg C0), 则 cicig (oa) < fo) 

过 czc2g (a). 因此 问题 转化 为 对 特殊 的 向 量 范 数 g(c), 证 明 式 (5. 1. 11) 成 立即 可 . 我 们 
自然 想到 了 2 范 数 . 
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设 任意 w EV 在 V 的 一 组 基 @i ,az ，…,0n 下 的 坐标 向 量 为 x € Fr, 则 由 定理 5.1. 3 
可 知 
fla) = lal= lxl 
对 于 特殊 的 g(a), 则 有 g(a) = |xl;. 
下 证 fa) = | xl 是 连续 函数 . 设 任意 PP E V 在 @i,@，… ,0 下 的 坐标 向 量 为 yEK, 
则 了 (BP = | ?| ,注意 到 |x。 过 1x| 志 x|xls, 从 而 
| Fo) —f P|= | |x|—lyll< lx—yl<xlx oy|. 


因此 , 当 |x 一 ys。 二 6 即 x,y 非 常 接近 时 ,有 | fle) 一 f(P)| 志 m6, 即 f(a),f(B) 也 非常 
接近 ,这 就 是 说 f(a) = |x| 是 x 的 连续 函数 . 

根据 连续 函数 的 性 质 ,在 有 界 闭 集 S== {x 二 (zi,zs,…,zx,) TE C"||xl; = 二 1) 即 单 
位 球 上 ,函数 f(a) = 上 x| 可 取 到 最 大 值 M 和 最 小 值 m, 而 且 关 之 0 (否则 x 一 0, 与 xE 
S 了 矛盾 ). 


令 d== |zxlsx 一 部 ， 则 | zj， 二 


地 |x|: 一 1, 即 z€ S, 因此 f(x) = 上 1z| 满足 
0<m<f7= lzl<M 
这 里 ,z 是 7 在 Qi,@z，…,@, 下 的 坐标 向 量 . 又 由 于 x 二 dz，, 从 而 
flo) = |xl= lal= dlz|= df(7) = f(y)g(0) 


这 样 ,就 有 mg (@) 过 f(a) 过 Mg (Qa), 即 f(@) 与 g(@) 等 价 .证 毕 . 

注意 这 个 结论 对 无 限 维 未 必 成 立 . 另外 ,根据 等 价 性 ,处 理 向 量 问题 (例如 下 一 章 的 
向 量 序列 敛 散 性 问题 ) 时 ,我 们 可 以 基于 一 种 范 数 来 建立 理论 ,而 使 用 另 一 种 范 数 来 进行 
计算 . 


5.2 和 矩阵 范 数 


5.2.1 和 矩阵 范 数 的 概念 


向 量 是 特殊 的 矩阵 ,同时 一 个 m Xn 阶 的 矩阵 也 可 以 看 成 一 个 mn 维 向 量 ,因此 我 们 
自然 想到 将 向 量 范 数 推广 到 和 矩阵 范 数 . 

定义 5.2.1 〈 和 矩阵 范 数 ) 对 严 ” 中 的 任意 矩阵 4, 如 果 按照 某 种 对 应 法 则 ,都 有 一 
个 非 负 实数 p(4) 与 之 对 应 ,并且 p(4) 还 满足 下 列 三 条 性 质 . 

(1) (正定 性 ) p(4) 宇 0, 当 上 且 仅 当 4 王 O 时 , p(4) = 0; 

(2) (正章 性 ) 对 任意 XE F, 成 立 pg(24) == |4|g(4); 

(3) (三角 不 等 式 ) 对 任意 A,B € F”, 都 有 gp(A 十 B) 过 pg(A) 十 g(B)， 
则 称 pg(4) 是 矩阵 4 的 (广义 ) 和 矩阵 范 数 (matrix norm) , 记 为 14| ,或 141|. 

显然 这 里 的 映射 p 将 矩阵 4 映射 为 实数 pC4) = 14| , 即 p:4Pp(C4A) = 14l. 

比照 向 量 范 数 ,我 们 自然 可 猜想 到 相应 的 矩阵 范 数 的 形式 . 
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例 5.2.1 对 任意 4 一 (a;) GE FY”, 由 


| (5. 2. 1) 
1 一 1 j=1 


定义 的 p(4) 是 F”Y” 上 的 矩阵 范 数 , 称 为 矩阵 4 的 mi 范 数 , 记 为 |4|，. 
证 明 : 正 定性 和 齐 次 性 是 显然 的 . 下 证 三 角 不 等 式 . 设 任意 B = (b;) E F””, 则 


p(A 十 B)== SS | as 二 +b; | 过 XC | 十 |5; |) 
d= Jl Pi 


一 oz| 十 > 2 16;|= 9(A4) + p(B) 
i 一 1 /一 1 


1 一 ] /一 1 


因此 ‖4|。 是 矩阵 范 数 . 
例 5.2.2 对 任意 4 一 (aj) E Fr”Y, 由 


P(4) 一 max la | (§. 2 2) 


定义 的 pg(4) 是 Fr” 上 的 矩阵 范 数 , 称 为 矩阵 4 的 me 范 数 , 记 为 |4|，. 
证 明 : 留 作 练习 . 
例 5.2.3 对 任意 A = (ay) € ”YY”, 类 比 式 (5.1. 2), 我 们 定义 


mr 天 1 
9p(4) = (DD as|’)’ = (tr(ANA))? (5. 2. 3) 


1 一 1] 7 一 1 
则 p(C4) 是 玉 ”” 上 的 矩阵 范 数 , 称 为 矩阵 4 的 ms 范 数 或 Frobenius 范 数 (简称 下 范 数 ) ,也 
称 为 Schur 范 数 或 Hibert-Schmidt 范 数 , 记 为 14 或 Als. 


由 于 14|? = 5 上 ali, 这 里 @j 为 4 的 第 j 列 (j 二 1,2,…,n), 因 此 下 范 数 也 被 称 为 
Euclid 范 数 . 特别 地 , 当 n 二 1 时 矩阵 4 退化 为 列 向 量 x*, 此 时 | xls = Dx|;. 

证 明 : 正 定性 和 齐 次 性 是 显然 的 . 三 角 不 等 式 即 为 p = 2 时 的 Minkowski 不 等 式 . 
证 毕 . 

显然 , 当 ? 三 工时 ,和 矩阵 4 的 mi 范 数 、ms 范 数 和 ms 范 数 分 别 退 化 成 了 向 量 的 1 范 
数 、oo 范 数 和 2 范 数 . 

在 Matlab 中 ,内置 函 数 norm 也 可 用 于 计算 矩阵 4 的 下 范 数 ,调用 格式 为 


norm(A, 'fro') 
至 于 矩阵 4 的 mi 范 数 和 ms 范 数 ,也 可 通过 简单 的 编程 来 解决 . 
5.2.2 算 子 范 数 及 范 数 的 相 容 性 
和 矩阵 不 仅仅 是 向 量 的 推广 , 它 还 可 以 看 成 变换 或 算 子 . 事实 上 ,从 算 子 或 变换 的 角度 
来 定义 范 数 能 让 我 们 更 深刻 地 理解 矩阵 范 数 . 


定义 5.2.2 ( 算 子 范 数 ) 对 任意 A E FF , 非 负 实数 g(4) 表示 变换 A 可 以 “ 拉 伸 ” 
任意 向 量 x € 的 最 大 倍数 ,也 就 是 使 不 等 式 
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u(Ax) culx) (5. 2. 4) 


成 立 的 最 小 的 数 c. 我 们 称 PC4) 为 向 量 范 数 u(x) 和 向 量 范 数 v(x) 诱导 出 的 矩阵 范 数 ， 
简称 为 诱导 范 数 (induced norm) ,也 称 为 算 子 范 数 (operator norm), 记 为 Al,, 或 简 记 
为 上 141. 特别 地 , 当 x(x) 与 v(x) 相同 时 , 称 算 子 范 数 pg(4) 为 向 量 范 数 ulx) 诱导 出 的 矩 
阵 范 数 , 记 为 A 或 简 记 为 |4| 

由 矩阵 范 数 的 正 齐 性 可 知 4 的 作用 是 由 它 对 单位 向 量 的 作用 所 决定 的 ,因此 可 以 等 
价 地 用 单位 向 量 在 4 下 的 像 来 定义 矩阵 范 数 , 即 


u(Ax) _ maxu(Ax) 
v(xX) WH)=1 


4 


若 用 | xl, 表示 向 量 范 数 u(x), | xj, 表示 向 量 范 数 v(x), 则 上 式 也 就 是 
|axl, 


特别 地 ,对 算 子 范 数 |4|。, 令 了 = | xl,y 一 考 , 则 | ?1. 一 址 |x ==1, 从 而 
四 14xl， __ x 
alm Tl al 
= max |Ay|, = max |Ax|, (5. 2. 6) 
lyll ,=1 1 xl ,=1 


从 几何 上 看 式 (5. 2. 5), 说 明和 矩阵 范 数 14| 反映 了 线性 映射 4 把 一 个 向 量 x 映射 为 
男 一 个 向 量 Ax 后 ,向 量 的 “长度 " 缩 放 的 比例 的 上 界 . 


注意 到 141 三 二， 即 14x1, < 141 .| xl。, 这 显然 让 人 联想 到 矩阵 乘积 的 范 数 


1 xl|， 
不 超过 范 数 的 乘积 . 考虑 到 矩阵 乘法 在 矩阵 运算 中 的 重要 地 位 ,因此 讨论 矩阵 范 数 时 一 
般 要 附加 “ 相 容 性 条 件 ”. 
定义 5.2.3 《〈 和 矩阵 范 数 的 相 容 性 ) 对 任意 4 € F”,B € F*” 及 矩阵 范 数 $8,p,Y, 如 果 


g(C4AB) < p(CA)7Y(B) (5. 2.7) 
也 就 是 
|4B|, 入 |Al,lBl, (5. 2. 8) 


则 称 和 矩阵 范 数 %,p 和 7 是 相 容 的 (compatible)， 特 别 地 , 当 4,B 是 同 阶 方 阵 且 和 矩阵 范 数 
$,9p 和 7y 相同 时 , 式 (5. 2. 8) 就 变 成 了 


14B1. 坟 141.1231。 (5. 2. 9) 


此 时 ,我们 称 和 矩阵 范 数 是 自 相 容 的 矩阵 范 数 ,简称 为 相 容 范 数 (compatible norm). 
男 外 ,如 果 和 矩阵 B 退化 为 列 向 量 x, 矩阵 范 数 $,y 退化 为 同一 个 向 量 范 数 时 , 式 
(5. 2. 8) 就 变 成 了 


laxl. < 1al,lxl, (5. 2. 10) 
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此 时 ,我们 称 矩 阵 范 数 p 与 向 量 范 数 是 相 容 的 . 
例 '5.2.4 和 矩阵 的 za 范 数 和 下 范 数 都 具备 “ 相 容 性 条 件 ”, 即 成 立 


14B|, <|Al, 1B|, ,1ABl|: < |AlslBls 
证 明 : 对 任意 A,B E FF 有 
SS > |az | 16 |) 


14B 1。 之 之 ， 2 nby 
fl 记 1 js1 hl 


< 31 > 有 3 lax|: > | 6 | ] (Cauchy-Schwartz 不 等 式 ) 


i 一 1 j=1 


= [> EAE > 2m!] (les | 与 无 关 ,外 提 ) 
= 如 la wl (同上 ,六 于 1 | 与 :无关 ,外 提 ) 
一 141。1B1。 


[用 = S| Sia 
i=1 j=!1 k=!1 =1 j 


i=1 j=1 


(> |ax | [5s |) 
< bp > | >， [oz |2? 。 > | bw [2] (Cauchy-Schwartz 不 等 式 ) 
i 在 Re k=1 


一 >2) 21ax|:. >) 2 16w1: (外 提 ) 
i=1 =1 j=1 k=1 
= |Al:. |Bl|s 


即 |4B1z 之 14ls1Bls. 证 毕 . 
显然 ,此 例 说 明和 矩阵 的 ma 范 数 和 下 范 数 都 是 相 容 范 数 ,但 令 人 遗憾 的 是 矩阵 的 m。 


范 数 却 不 满足 " 相 容 性 条 件 ” 例如 对 于 短 阵 4 一 ( 1 ) ,就 有 


1421。 = 124|, =2>1= |1A4|, 
要 使 ms 范 数 满足 “ 相 容 性 条 件 ”, 则 可 以 修正 其 定义 为 
IAl;, =n. max lai,| (5. 2. 11) 


1<i<m, 1<i<n 


可 以 证 明 , 按 式 (5. 2. 11) 重新 定义 的 ms 范 数 满足 相 容 性 条 件 . 请 读者 补 上 这 个 证 明 . 
定理 5.2.1 ”上 的 下 范 数 与 上 的 2 范 数 是 相 容 的 . 


证 明 : axl = 2 | Pal < (Ble lsl) 
= > aa: )(Plsl ) ] (Cauchy-Schwartz 不 等 式 ) 


= | 。 (32151°) = Il 
即 |4x|， < 14 -| zx| 证 音 


第 5 章 范 数 及 其 应 用 。217 。 


根据 算 子 范 数 的 定义 式 (5. 2. 6)， 当 向 量 范 数 w 分 别 取 |xlli、 | xl;、 | zl。 及 | zl， 
时 ,可 分 别 诱导 出 与 向 量 范 数 相 容 的 矩阵 范 数 PC4), 分 别称 为 1 范 数 .2 范 数 、w 范 数 和 pp 
范 数 , 并 分 别 记 为 141;、141;、14|。 及 141，,. 
我 们 先 来 推导 14| 和 141 的 表示 定理 . 
设 任意 矩阵 4 二 (olyoz ，…on) E F”" ,考虑 向 量 1 范 数 单位 球 : 
S 一 (人 一 (zyzwyzo)IE 下 | zl <1)} 


在 A 下 的 像 Ax 满足 


|axl,= D3273 1 要 Dsl al;〉 (三角 不 等 式 和 正 齐 性 ) 


去 (Cmaxle;l,). (2 |zj| )= maxlo;l .| zl， 
= maxl|a;|i, 
l<j<n 
从 而 | ax < maxle;|i. 
l<j<n 
如 果 maxla,l, 三 上], 则 选取 x == e, 此 时 由 es = 1, 可 得 


| Aei | = | a = max| wy | 
l<j<n 


因此 14l 一 max|eh 一 max > | | , 即 14|， 是 4 的 各 个 列 向 量 的 1 范 数 的 最 
大 值 ,所 以 Aj 即 1 范 数 又 被 称 为 列 和 范 数 (column sum norm). 
类 似 地 ,可 得 到 14|。 = pmax > |a | , 即 14| .是 4 的 各 个 行 向 量 的 m 范 数 的 最 大 
| 


值 , 所 以 4|。 即 m 范 数 又 称 为 行 和 范 数 (row sum norm). 
综合 上 述 分 析 , 三 种 算 子 范 数 具有 如 下 的 表示 定理 : 
定理 $. 2. 2 ( 算 子 范 数 的 表示 定理 ) 对 Fr”* 中 的 任意 矩阵 4A, 有 


14 = maxla, 及 二 下 全 2 [zyl (5. 2. 12) 
141 = max 2 |as | (C5, 2,13) 

Sn j=1 
| = Var AA) (5. 2. 14) 


证 明 : 前 两 个 表达 式 前 已 证 明 . 下 面 证 明 第 三 个 表达 式 即 2 范 数 的 表达 式 . 
易 证 A"A 三 0. 设 484 的 特征 值 为 宇和 之 宇 0, 对 应 的 完备 正 交 系 为 xi ,xX ，…， 
3， 则 对 于 任意 的 2 范 数 单位 向 量 x E Fr ( 即 上 |x|; = 1 ), 必 存在 一 组 复数 x ,zs ,…,z, , 使 得 


区 二 入 十 台 2 丰 


由 于 AHAx 一 AHA . Dzix; 一 SCArAx,) = Sa 因此 
i=1 i=1 i=1 
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|Ax|3= x"(A"Ax) = (2) zx )[ 2 zi Aixi)] 
i=1 i=l 


n n 
= Dw zs)” =x = 
i=1 i=1 


所 以 上 14l; = max |Axl; < VA. 


| xll ,=1 


另外 ,注意 到 |x|; = 二 1, 且 上 Axi13 = xFA?Axi 一 xx 一) 因此 
141: = max ,| xl — yh = Wm AD 
证 毕 . 
注意 ,和 矩阵 的 2 范 数 因为 涉及 特征 值 , 又 称 为 谱 范 数 (spectral norm). 
请 读者 要 特别 注意 的 是 , 当 和 矩阵 A 退化 为 列 向 量 x € Fr 时 ,和 矩阵 范 数 ‖4|，, 与 向 量 范 


数 |xli 一 致 , 141。 与 1zl。 也 一 致 ,但 141: 与 上 xl; 就 不 一 致 了 . 
我 们 同样 从 几何 上 再 来 直观 理解 这 三 种 算 子 范 数 . 


] 2 
例 5.2.5 分 别 求 矩 阵 4 一 (。 。) 的 1 范 数 .2 范 数 和 w 范 数 ,并 考察 与 它们 对 应 
的 三 种 向 量 范 数 的 闭 单位 加 S 一 (x € C*||x| 过 1) 在 矩阵 4 作用 下 的 效果 . 
解 :经 过 简单 计算 可 知 | 4| 一 4,14|。 一 3,14|s 一 /二 9 十 V 现 ) ~ 2.9208 


] 0 1 2 3 
对 @ -= (jj 3 (i) 一 加 十 ex 3 ()， 显然 4e， 一 和 ,4e， (2) 4 一 (>): 
|e， |， = | es = |e， = 1， |e: |， |e:1, = 1s | ez 一 2V2 ; 
14e; 一 1 |e | ,4e， | < C2,2)7 = |Alilesl; 


| 4e, |; Ls le 1， ,14e， | ， 一 上 2,2271， = 2V2 > |Al;l|e|;; 
|Aes|s= |(2,2)7),= 2. |els,|Aesl|,= |Al, lesl,. 
闭 单位 圆 S 在 矩阵 4 作用 下 的 三 种 度量 效果 如 图 5 - 4 所 示 . 


图 5-4 三 种 矩阵 范 数 的 效果 
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在 Matlab 中 ,内 置 函数 norm 同样 可 用 于 计算 矩阵 4 的 算 子 范 数 ,调用 格式 分 别 为 
norm(A,l1) ,norm(A,'inf') ,norm(A,2) 


其 中 ,norm (A,2) 常 缺 省 为 norm (A). 
5.2.3 ”和 矩阵 范 数 的 几 个 性 质 


由 于 C” 是 复数 域 上 的 mn 维 线性 空间 ,因此 由 定理 5. 1. 5, 向 量 范 数 的 等 价 性 也 
可 推广 到 矩阵 范 数 . 

定理 5. 2.3 〈 和 矩阵 范 数 的 等 价 性 ) 对 任意 4E C”™, 设 go(4) 和 YA) 是 Cr" 上 的 
两 个 矩阵 范 数 , 则 必 存 在 正 数 ci ,cz , 使 得 


cag(CA) SZ pA) 二 cag(C4) (5. 2. 15) 
证 明 : 略 . 

定理 $. 2.4 ( 谱 范 数 的 性 质 ) FY" 上 的 谱 范 数 具 有 下 列 性 质 ， 

(1) |4|; = _ yAx|, 其 中 x€EF,yE "和 且 |xl; = |yl;=1; 


Mela, 
(2) |4°|, = |4l;; 
(3) | 44|; = |4l2. 
证 明 :(1) 由 Cauchy-Schwartz 不 等 式 ,并 注意 到 |x|; = |y|; = 1 及 相 容 性 , 则 


[y’Ax|< lyl:lArl, = 14rl: < 1Al:lx|; = 141， 


设 有 xo EF 且 | xo ls 二 1 使 得 |Axo|; 3 IAl;, 令 令 d = |Axo|;, 用 一 oe, 则 有 


ly8hro| 一 元 (Axo) "(hxo) 一 证 1Axol# a == 14l， 
因此 |4l, 一 | me yAr| ,rE FyEE. 
(2) 令 z= 二 yiAx, 则 z 二 2 一 (ynAx)9 二 xtiAHy 且 |z|== |z|, 因此 由 (1) 可 知 


|A|;= _, yAx|= max |xiAy| 
ela , x a = ,= 


[yAnx|= |4"|; 


a, 


《3) 由 矩阵 范 数 的 相 容 性 及 (2) 可 知 , A54|; 过 上 145|,|4|, = |4|2. 
设 有 向 量 z GE Fr 且 |xols == 1 使 得 上 4xo|, = | 上 4A|;, 则 


IA Al;, = I | A HAxo | = Ta |Axols = == |al? 


xo, 

证 毕 

向 量 的 Euclid 范 数 具有 酉 不 变性 ,F 范 数 和 谱 范 数 作 为 它 的 推广 ( 哪 一 个 更 “ 正 
宗 ”?) ,是 否 也 具有 西 不 变性 呢 ? 

定理 5. 2. 5 〈 扼 阵 范 数 的 酝 不 变性 ) F” 上 的 下 范 数 和 谱 范 数 都 是 西 不 变 的 , 即 对 
任意 酉 矩阵 U,Y € C”*, 均 有 
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Ivals = |Als = 1Aavls,lvAl; = 14|l, = lavl; 


证 明 : 令 A= (a ,gy,…,0r) EP” 由 于 Ue 是 列 向 量 ,因此 Uej|s 二 TUej|;, 再 
联想 到 Euclid 范 数 的 酉 不 变性 ,可 知 oj jz = oil = loj|;, 从 而 


[val = | Ve Ue Uae) = 2 |Unl? = > ol? = |Als 
j=1 j=1 


此 即 UA1s = 14l:. 利用 这 个 结论 和 4 1, 二 1A;，, 可知 
|Avls 人 | CAV) ls 二 [vAN|s 二 | 483 
对 于 谱 范 数 的 情形 ,利用 定义 和 Euclid 范 数 的 酉 不 变性 , 即 有 


luals = px loaxl: = exilarl = 14|: 


证 毕 

对 于 j 普 范 数 ,定理 的 结论 还 可 以 推广 到 半 丁 矩阵 U,Y. 亲爱 的 读者 ,你 能 证 明 它 吗 ? 

矩阵 4 的 SVD 即 4 三 [恶人 扩 采 用 的 是 西 相似 ,这 样 对 4 的 研究 就 转化 为 对 其 标准 型 
互 的 研究 . 既然 4 的 下 范 数 和 谐 范 数 都 是 本 不 变 的 ,那么 用 奇异 值 就 能 表示 它们 . 

定理 5.2.6 〈 范 数 与 奇异 值 ) 对 任意 矩阵 A € F”, 设 a 二 … 志 二 0 表示 矩阵 A 
的 7 个 非 零 奇异 值 ,其 中 7x 二 r(4), 则 

(1) |Al: =0a,|Als = Vo 二 +… 二 oo; 

(2) 4l; 过 Als, 等 号 成 立 当 上 且 仅 当 (4) = 1. 

证 明 :(1) 设 4 的 SVD 为 4 一 UZVa, 则 


14l,= lvzv"l; = 12 = hs, |zxl; 


-= | 羡 琶 (oz 2 十 |oz| 2 十 … 十 |oz， |253 


a I (zl 二 |zxz|? 十 … 十 |z,|? )3 


a SS Cz 二 |zxz| 十 … 十 [zx] 十 |zm|? 十 … 十 |z12)3 


— 1 | xl， ol 


IAls= |UEv ls = |Bls = Veit+… 二 + 

(2) 的 结论 从 (1) 中 可 显然 得 出 . 证 毕 . 

二 和 SVD 小 试 牛 刀 , 它 的 巨大 威力 后 文 还 会 逐渐 展开 . 

定理 5.2.7 〈 和 抢 阵 范 数 与 向 量 范 数 的 相 容 性 ) 设 为了” 上 的 任意 矩阵 范 数 ，w GE 
严 为 给 定 的 非 零 向 量 , 则 


u(x) 一 PC )， xEF 


是 与 g 相 容 的 向 量 范 数 . 
证 明 : 当 上 且 仅 当 x 关 0 时 xy8 了 关 O, 即 u(x) 二 p(xy8) 之 0; 当 且 仅 当 x 一 0 时 
xy0 二 0, 即 u(x) 二 g(O0) 二 0. 正定 性 和 齐 次 性 类 似 也 不 难 证 明 . 因此 * 是 下 上 的 向 量 
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范 数 . 

注意 到 对 任意 A € F*”Y, wu(Ax) 二 p(Axy8) 之 pg(4)p(xy98) 二 pg(A)ulx), 因 此 妈 还 
是 与 p 相 容 的 向 量 范 数 . 证 毕 . 

由 于 yo 不 是 唯一 的 ,因此 定理 5. 2. 7 中 的 向 量 范 数 也 不 是 唯一 的 . 事实 上 ,和 矩阵 范 
数 与 向 量 范 数 的 相 容 性 关系 比较 复杂 . 概 而 言 之 ,对 任意 给 定 的 矩阵 范 数 ,一 定 存在 与 之 
相 容 的 向 量 范 数 ,但 这 样 的 向 量 范 数 未 必 唯 一 :反之 ,对 任意 给 定 的 向 量 范 数 ,也 一 定 存 
在 与 之 相 容 的 矩阵 范 数 ,但 这 样 的 矩阵 范 数 也 未 必 唯 一 . 

对 与 某 向 量 范 数 x 相 容 的 矩阵 范 数 p 而 言 , (CD 二 上 三 1, 因为 u(x) ==u(Ix) 过 
gCDulx)，, 但 是 对 算 子 范 数 pg ( 按 定义 p 与 相应 的 向 量 范 数 相 容 ), 则 有 p(CD = | 中 = 1， 
因为 此 时 


PCD = maxul Ix) = maxulx) 二 1] 
u(x)= u(x)= 


定理 5. 2. 7 也 提供 了 一 种 从 矩阵 范 数 出 发 来 构造 向 量 范 数 的 方法 . 事实 上 , 当 yo = 
e 即 单位 矩阵 工 的 第 ; 列 ( i 任意 指定 ) 时 , 关 和 矩阵 范 数 g 分 别 取 mi 范 数 下 范 数 、2 范 数 或 
o 范 数 , 则 向 量 范 数 就 是 相应 的 1 范 数 、2 范 数 .2 范 数 和 om 范 数 . 至 于 从 向 量 范 数 出 发 
来 构造 矩阵 范 数 的 方法 , 算 子 范 数 显然 已 经 给 出 了 一 种 解决 之 道 . 


5.3 范 数 的 几 个 应 用 


长 度 和 距离 在 实 分 析 和 复 分 析 中 的 应 用 ,我 们 已 经 有 充分 认识 ,而 范 数 是 长 度 和 距 
离 的 推广 ,因此 范 数 作 为 一 种 推广 的 度量 ,由 于 其 抽象 性 和 概括 性 ,其 应 用 范围 自然 也 随 
之 扩展 . 至 少 在 矩阵 分 析 与 计算 领域 , 范 数 有 着 许多 深刻 的 应 用 . 当然 ,从 本 质 上 讲 , 范 数 
就 是 线性 空间 V 上 的 一 种 映射 或 函数 (大 多 不 是 线性 的 ). 我 们 已 经 见识 了 线性 空间 的 浩 
木 波涛 ,再 加 上 映射 或 变换 的 丰富 多 彩 , 如 此 就 不 难 想 象 范 数 的 深 窒 幽深 了 . 
5.3.1 谱 半 径 与 矩阵 范 数 

设 (4,x) 为 方 阵 4 的 任意 特征 对 , 即 Ax = Ax， 考虑 到 范 数 相 容 性 ,可 知 

[al: |xl= laxl= 14xl< 1a|. |xl 

因为 特征 向 量 x 冯 0, 此 即 上 |x| 二 0, 从 而 |4| 志 141. 这 说 明和 矩阵 特征 值 的 模 都 不 
超过 它 的 范 数 . 

定义 5.3.1 若 入 ,和 hs,…,N 为 4 的 特征 值 , 则 称 max [Xi | 为 矩阵 4 的 谱 半 径 (spec- 
tral radius) , 记 为 op(4). 特别 地 , 称 满足 p(4) = |4| 的 特征 值 为 4 的 优势 特征 值 
(dominant eigenvalue) ,对 应 的 特征 向 量 x 为 4 的 优势 特征 向 量 (dominant eigenvector)， 
相应 的 特征 对 (4 ,zx) 为 4 的 优势 特征 对 (dominant eigenpair). 

思考 :这 里 的 谱 是 什么 意思 ? 谱 半 径 的 名 称 又 如 何 理解 ? 谱 半径 是 矩阵 范 数 吗 ? 

定理 5.3.1 对 4EF” 的 任意 矩阵 范 数 14| , 恒 有 

oC) 二 141 (5. 3. 1) 
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特别 地 , 当 A 是 正规 矩阵 时 ,等 号 对 2 范 数 成 立 . 

证 明 : p(4) 过 上 141 的 证 明 前 已 给 出 . 

当 A 是 正规 阵 时 ,有 谱 分 解 A 二 UAU, 从 而 上 14|; = 1vAUM|; = 上 Al:. 由 定理 5.2.6 和 
推 沦 441 可 知 1Al: 二 max|X| 二 p(4), 从 而 14l: 二 6 (4)。. 证 毕 . 

另外 ,根据 矩阵 范 数 的 相 容 性 ,可 知 441 入 14 全, 因此 p(4*) 过 p (4)*. 
一 1 1 0 
一 4 3 0 

1 0 2 
解 : 例 2.5. 1 中 已 算出 4 的 特征 值 为 2,1,1, 因此 pC(4) = 2. 
在 Matlab 中 ,使 用 内 置 函 数 vrho 或 直接 使 用 其 定义 代码 
max (abs (eig (A) ) ) 

可 以 计算 出 方 阵 4 的 谱 半 径 o(4). 

定理 5. 3. 1 给 出 了 和 矩阵 谱 半 径 的 一 个 上 界 , 那 么 矩阵 谱 半径 的 下 界 是 什么 呢 ? 

定理 5.3.2 对 任意 A E F”, 存在 F*”Y” 上 的 某 种 矩阵 范 数 p(4), 使 得 对 任意 6 二 0， 
恒 有 


例 5.3.1 求 矩 阵 4 一 的 谱 半径 oC4). 


PC4) 一 se 委 0(C4) (5; 3; 2) 


注意 :这 里 的 矩阵 范 数 p(4) 与 矩阵 4 有 关 . 
证 明 : 对 任意 矩阵 4, 存在 Jordan 标准 型 


A1 Ai 
人 2 a 

PAP 一 了 一 | =A+N 

Ve ml 

An 

0 Ai 

日 、 
这 里 , &; 二 0 或 1, A 二 diag(N1,Ah2 ,A,),N 二 四 

“二 ml 
0 


令 D= diag(l,e,e ee) 则 DOP APD = DTJD = A 十 eN. 再 令 p(4) = 
1s "4S|。, 这 里 $= PD, 易 证 pg(4) 是 FY 上 的 一 种 矩阵 范 数 ,从 而 


94)= 1S"AS|,= max(|X|+ek;) < max(|Xi|+e) 
= max|Xi;|+e = p(A) +e 
证 毕 . 
这 个 优美 的 证 明 是 奥 斯 特 洛斯 基 ( 请 不 要 与 4 钢铁 是 怎样 炼 成 的 》 的 作者 尼 . 奥 斯 特 
洛 夫 斯 基 混 消 ) 在 1960 年 给 出 的 . 奥 斯 特 洛斯 基 (Alexander Ostrowski, 见 图 5- 5) 出 生 
于 基辅 ,后 被 推荐 至 德国 马 堡 大 学 , 师 从 享 泽 尔 (Kurt Hensel,1861 一 1941,p 进 数 [不 是 p 
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进 制 数 ] 的 发 现 者 ). 第 一 次 世界 大 战 中 ,作为 敌国 之 
人 ,他 的 行动 严重 受 限 制 ,但 所 幸 经 享 泽 尔 昔 苗 奶 求 ， 
德国 当局 同意 让 奥 斯 特 洛斯 基 使 用 图 书馆 . 战 后 ,在 
希 尔 伯 特 和 兰 道 (Edmund Georg Herman Landau， 
1877 一 1938, 写 作 以 行文 精练 简洁 著称 ,被 称 为 兰 道 
风格 ) 指 导 下 ,他 获得 哥 廷 根 大 学 博士 学 位 . 6 年 后 ， 
他 开始 担任 巴塞 尔 大 学 (瑞士 最 古老 的 大 学 , 欧 拉 和 
发 现 洛 必 达 法 则 的 约翰 。 伯 努 利 (John Bernoulli) 都 
是 该 校 校友 ) 数 学 系 系 主任 ,直至 退休 . 

在 矩阵 分 析 与 计算 领域 , 奥 斯 特 洛斯 基 最 著名 的 
工作 是 关于 范 数 的 一 般 性 理论 及 其 在 发 现 不 等 式 、 研 、 ,| 
究 求解 线性 方程 组 的 方法 ,以 及 发 现 和 逼近 特征 值 等 图 5-5 奥 斯 特 洛斯 基 (1893 一 1986) 
方面 的 应 用 . 事实 上 ,他 一 生 共 发 表 270 余 篇 (本 ) 著 
作 , 涉 及 代数 (线性 代数 多重 线 性 代数 、 形 式 人 代数、 数论) 几何、 拓扑 、 函 数论 、. 数 值 分 析 
等 领域 . 他 既 能 强调 数学 的 抽象 与 公理 化 ,又 能 着 力 于 数学 的 具体 和 构造 性 ,可 谓 理论 与 
应 用 并 重 ,“ 是 无 与 伦比 的 大 师 ”! 

奥 斯 特 洛斯 基 离 世 不 久 , 遵 其 遗愿 ,以 他 留 下 的 遗产 为 基础 建立 了 奥 斯 特 洛斯 基 基 
金 会 ,并 颁发 国际 性 的 奥 斯 特 洛 斯 基 奖 ,每 两 年 一 次 ,以 奖励 一 .二 位 最 近 五 年 在 纯粹 数 
学 或 数值 分 析 的 基础 理论 方面 有 突出 成 就 的 数学 家 . 

例 5.3.2 设 c 为 民 " 的 单位 列 向 量 , 即 xiwx 王 1. 令 号 一 工 一 ax ， 则 

(1 B* = .B; (2) 2(B) = 1; (3) I = 1 

证 明 :(1) 因 为 a @ 二 1, 所 以 

B= (I—ox')(I—ar') = I 200' ox'om! 
=I—2o0' Ta(a'oa' 一 工 一 2ox7T 十 ooxT =I—ox'=B 

(2) 因 为 (ax )e 一 a(Cxra) 一 ww 一 1。.w,7rCoxI) 一 1, 并且 owT 是 对 称 矩 阵 , 所 以 1 
是 和 矩阵 ax: 唯一 的 非 零 特 征 值 ,因此 ,矩阵 oz 的 特征 值 为 1,0,0,…,0, 即 和 矩阵 B 的 特征 
值 为 0,1,1,…,1, 从 而 p(B) 一 max| hi| 一 1. 

(3) 因 为 B = B, 所 以 B 是 对 称 和 矩阵 ,因而 也 是 正规 矩阵 ,由 定理 5.3.1 可 知 上 1B|; = 1. 

思考 :除了 2 范 数 ,前 面 的 矩阵 范 数 几 乎 都 只 是 对 矩阵 元 素 简 单 和 低级 的 加 工 . 而 与 
之 相 比 , 谱 半 径 的 计算 显然 要 复杂 得 多 . 如 此 来 说 ,引入 谱 半 径 的 意义 又 何在 呢 ? 


5.3.2 线性 方程 组 解 与 矩阵 逆 的 扰动 分 析 


例 5.3.3 线性 方程 组 
1 0.99 


zl 


] 
= | (5. 3. 3) 
0. 99 0.98 1 


的 精确 解 为 x 三 100,z = 一 100. 如 果 系 数 矩 阵 和 常数 项 有 扰动 (perturbation ) 


0 0 0 
? 见 Lz 线 旦 a 1 ar Systems) ; 
(。 6 oo 和 可 cn ) 则 扰动 线性 方程 组 (perturbated linear systems) 为 


Ly 
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1 0. 99 1 


0.99 0.99 1.001 


它 的 精确 解 为 zi 十 6zr1 二 一 0. 1,zz 十 Qz* 二 10/9. 显然 ,由 于 系统 (5. 3. 3) 本 身 的 固 
有 性 质 ,原始 数据 的 小 扰动 引起 了 解 的 很 大 变化 ,因此 它 是 病态 的 (敏感 的 ) 或 不 稳定 的 . 

下 面 我 们 用 范 数 来 定量 分 析 系 数 矩 阵 和 常数 项 的 扰动 对 线性 方程 组 解 的 影响 . 

设 非 奇异 线性 方程 组 hx 二 b 经 扰动 后 仍 有 唯一 解 x 十 Ax, 即 成 立 


(A 十 AA) (x 十 Ax) 一 十 Ab 
因此 A .Ax = 一 A4 .xx 十 Ap 一 AAAx, 即 
Ax =—A'AA .x+A!'Ab—A'AAAx 
两 边 取 范 数 ,并 利用 三 角 不 等 式 和 范 数 的 相 容 性 ,缩放 可 得 
1Agl 委 11432111Aal zl 十 42 1Asl 二 4321. |As|. | axl 
显然 ,如 果 有 | 4 一 上 1Aa| 到 1, 则 可 得 到 绝对 误差 (absolute error) 估 计 式 


lazl< TA Laar dal: lxl+1asl) 
i |ax| _- | |Ap 
也 就 是 i < Ta TaaT (I+ A ) 


再 由 hx 一 5 可 得 151 一 14x|< 141. 1zl, 即 人 < 尾 ， 因此 
I < A (lal+ list lal) 


<1—Ta-T Taall fol 


147'|. |4 Ab 
1— a7l. (的 + 前 ) 
-<( 峻 人 + 外!) (5. 3. 4) 


这 里 ,x = 二 47 上: 14| ,y= 1 一 下 外 式 (5. 3. 4) 被 称 为 相对 误差 (relative error) 估 


计 式 . 

显然 在 式 (5. 3. 4) 中 ,系数 «反映 了 方程 组 解 x 的 相对 误差 对 于 系数 和 矩阵 4 和 常数 
项 的 相对 误差 的 依赖 程度 . « 越 大 ,方程 组 解 的 相对 误差 也 越 大 . 因此 x 类 似 于 微 积 分 
中 的 导数 . 

定义 5.3.2 对 非 奇异 线性 方程 组 Ax 二 b, 称 数 14 一 | 14| 为 求解 此 线性 方程 组 
的 条 件数 (condition number), 记 为 cond (4) 或 kx(4). 特别 地 ， 范 数 为 1 范 数 时 记 为 
5ki(4) ,为 2 范 数 时 记 为 x; (4), 为 wo 范 数 时 记 为 rx (A4). 

问题 是 非 奇异 线性 方程 组 hx 一 b 经 过 扰动 后 未 必 有 唯一 解 ,那么 何 种 扰动 能 使 得 扰 
动 后 的 矩阵 B = 4 十 AA 仍然 可 逆 ? 扰动 对 道 矩阵 又 有 何 影 响 ? 

由 于 也 一 4 一 4 (4 一 B) BT 一 一 A "1AA.，B', 两 边 取 范 数 , 并 缩放 ,得 
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1 一 4 入 14 81 和 Aal 
因此 


1 _ = 
本 二 全 < 1 8 .1Aal 和 141 . 12 1， 符 (5. 3. 5) 


观察 式 (5. 3. 5) 可 知 , 下 一 步 需要 缩放 | B- | . 
由 于 B= 二 A 十 A4 二 A(T 十 A 1AA)，, 若 假 定 I 十 A471AA 可 逆 , 则 BT 一 (GT 十 AT1A4) 4 ， 
两 边 取 范 数 , 并 缩放 ,得 


1B7|< +A TAA |. 14 (5. 3. 6) 
将 之 代 人 人 式 (5. 3. 5)，, 可 知 


| 一 
二 全 = [al 141. cz 十 AAA) 所 (5.3.7) 


显然 ,在 式 (5. 3. 7) 中 ,需要 进一步 缩放 ‖ CI 十 4 A4) 卫 |. 
令 C= 一 人 1A4, 由 于 


I= (一 CT 一 C) = (一 CO- 一 (一 CC 
即 (一 CC) 一 天 TH (CI 一 C)-C, 两 边 取 范 数 ,并 缩放 ,得 
la—on|<lr+lam=o7l. lcl 


若 有 条 件 |C| < 1, 则 由 上 式 可 知 1 一 O71< 和 生生， 此 时 C 的 任意 特征 值 


I4l 壹 1cl 过 1, 从 而 I 土 C 的 特征 值 1 士 +E (0,2) 或 (一 2,0), 均 不 包含 零 , 因 此 和 矩阵 
T 士 C 是 可 逆 的 . 

综合 上 述 分 析 , 即 得 如 下 的 定理 . 

定理 5.3.3 对 任意 CE FY, 如 果 |C| 过 1, 则 矩阵 工 士 C 非 奇异 , 且 


人 [al 
< Te (5. 3. 8) 
在 前 面 的 分 析 中 ,由 于 C = 一 A47'AA, 若 将 条 件 由 cl 入 1 修改 为 14 上. 1A4| 壹 
1, 则 
1cl = | 一 42A4a1 委 1421.1Aal 芝 1 (5. 3. 9) 


即 仍 有 |Ccj| 委 1. 如 果 再 假定 1 二 1, 则 由 定理 5. 3. 3 和 式 (5. 3. 9) 可 知 , 式 (5. 3. 6) 就 恋 
成 了 


| 1 
B- | 去 4 
wn 
1 
4 | 委 一 
[al< TT Taal 
14-|= 


1 
|a7l (5. 3. 10) 
1—lal a. 
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也 就 是 修正 后 的 绝对 误差 估计 式 


| 8 瓜子 | 丰 - | (5. 3. 11) 


将 式 (5. 3. 11) 代入 式 (5. 3. 5), 即 得 修正 后 的 相对 误差 估计 式 
|B- 一 人 4- 加 | 二 14|. 工 |42 | [AA| Kk [LAA| (5 3 12) 
7 


a7 14 7y”Tf4j 
定义 5.3.3 对 非 奇 异 和 矩阵 4 E F*”, 称 数 4 | .1141 为 4 关于 求 逆 的 条 件数 ,也 
记 为 cond (4) 或 k(4). 男 外 ki(A4), xs(A) 和 ws (4) 的 含义 同 定义 5. 3. 2. 
定理 5.3.4 设 AE FF*” 非 奇异 , 且 I| = 1. 如 果 扰动 矩阵 A4 € F” 满足 条 件 
4 lAAI|<1 (5. 3. 13) 
则 :(1) 扰 动 后 的 矩阵 B= 二 A 十 A4 为 非 奇异 矩阵 ,有 目 绝 对 误差 估计 式 和 相对 误差 估计 
式 分 别 为 


1 
1B71= 了 14 | B- 一 二 <<， |Aa41| 


1A7 1 “Tal 
(2) 线 性 方程 组 Ax 二 bb 被 扰动 后 ,得 到 的 扰动 线性 方程 组 (A 十 A4) (x 十 Ax) 一 0 十 
Ab 有 唯一 解 x 十 Ax, 并 且 其 解 的 相对 误差 估计 式 为 
1Axl _- «(I+ 1 人 ) 
Tx Sy (TAT ToT 
Matlab 中 提供 了 内 置 函数 cond, 可 用 于 计算 矩阵 4 求 着 和 线性 方程 组 4x 二 b 求 解 
的 条 件数 (它们 的 计算 表达 式 显然 一 样 ) ,调用 格式 为 c= cond(ta,p) 或 c= cond(a), 后 者 
使 用 的 是 缺 省 的 2 范 数 . 
一 般 而 言 ,我 们 说 条 件数 大 的 矩阵 是 病态 的 ,但 具体 多 大 才 算 病态 的 ,没有 具体 标 
准 . 当然 ,实际 使 用 中 可 参考 最 著名 的 病态 矩阵 即 Hilbert 矩阵 . 采用 ow 范 数 ,计算 可 知 
ke(BH3) 二 748, k(Hs) 之 2.9X10,kCHio) 23.54 X108, 显然 增长 非常 迅速 . 


s.3.3 和 矩 阵 的 低 秩 逼近 及 其 应 用 


设 和 矩阵 人 和 E> 的 秩 为 7， 其 SVD 为 A 一 UZYVH ， 其 中 U = (ty U2 UU,), V = 
Cn) 将 对 角 阵 马 分 解 为 允 二 如 十 马 十 … 十 马 , 这 里 马 二 0) Ej E ,上 且 
a 


A= UEV® = UBiV® 十 UBEY 十 … 十 0UELVH 
— Uvi 十 gousvi 十 2*。 十 ov 
= obEtokE; ob, (8, 3. 14) 


其 中 ， E. 一 配 广 : € EF™, 显然 对 i 二 12 …,r 都 有 r(E,) 一 Ls 即 和 矩阵 E; 是 是 秩 1 和 矩阵 
(rank one matrix) ,因此 式 (5. 3. 14) 也 被 称 为 矩阵 4 的 秩 1 分 解 (rank one decomposi- 


tion). 
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秩 1 分 解 让 我 们 想到 上 一 章 提 到 的 各 种 谱 分 解 . 从 动态 的 眼光 来 看 , 若 记 
人 ob 十 oz 五 * Se +oBE., 

显然 , 随 着 的 递增 , hi 应 该 逐渐 接近 4. 不 仅 如 此 ,对 某 个 固定 的 & (这 仿佛 递增 过 程 中 
的 突然 定格 ) ,在 所 有 秩 为 & 的 矩阵 中 , 4 离 矩 阵 4 的 “距离 ”最 近 , 也 即 矩 阵 A4 是 矩阵 4 
的 最 佳 秩 k 逼近 (best rank-k approximation) ,或 者 换 句 话说 ,包含 4 中 的 “能 量 ” 最 多 的 
秩 & 和 矩阵 是 A. 

定理 5.3.5 设 和 矩阵 4 € FY 的 秩 为 r, 其 SVD 为 A 二 UBVi, 且 U == (wi oz， 
U,)， 及 硅 (@ sp, 7 ol 宇 o%2 字 … 二 和 二 0 为 A 的 非 零 奇 异 值 . 对 任意 1 三 k 声 7， 所 

Ui = (Cu WU) Ve = (vi sb2 9 We) Ee = oF oF 十 … + oeBE nm 


且 k 有 = 二 7 时 ,规定 oi = 0. 若 令 


A (5.3. 15) 
则 
(1) min|A—Bl: 一 用 4 一 如 一 any 《5. 3. 16) 
(2) min|A—Bl, =|A—Ali = om; 《5.3. 17) 
(3) min|A— Bl$ = 1A 一 Ai|$ = oi 十 of 十 … 十 . (5. 3. 18) 


证 明 :(1) 显 然 & 二 r+ 时 , A 一 4, 结论 显然 成 立 . 下 设 1 过 & 一 ”- 
由 UA.V = B= ob 十 oz EF, + oeEn 可 知 ， 


H Et O 
U (A—ADV = areHtH 十 at 有 Et toE, 


本 
O 
其 中 , B 二 diag(0，…0,oe or) 所 以 
|4—Ail; = IU (A —AdVl; = om 

对 任意 秩 & 和 矩阵 B € F”, 由 定理 4. 5. 3 可 知 存在 单位 正 交 向 量 组 mm ,x ，… ,x 4 EE 

C", 使 得 
N(B) = span(xi ,xs ,°° ,XxX, 4) 
因此 ,存在 2 范 数 单位 向 量 z, 使 得 z E N(B) 门 span(Cm ,请 wh ) 关 (0). 否则 
dimN(B) dim span(m mw) 一 2 十 1 


这 在 维 数 上 显然 是 不 可 能 的 . 
令 和 一 三 Wi 十 在 放 十 十 不 HH 则 对 了 一 & 十 2，…，7， 有 ojujviz 一 oo0 一 0， 
因此 


Az= oo 三 人 zz 十 asto vizt. ou vi 
三 H 
一 Gl1UI 人 < 十 azts 全 zx 十 NE 十 aeHH az 
= H 
= ol VIZ os Wz) + ou (VEZ) Wu 


= ght 二 ot 二 opten Wn 
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注意 到 Bz =0 且 |zl == 1, 从 而 
14 一 如 | 一 ax | (A—B)z|i 宇 1(4—B)z|? 一 |4z| 
zl 2 一 


一 of#f 十 o2&2 十 … 十 okten 宇 o2 (4 十 如 十 … 十 六 1 ) 
= oi | zx 有 = op 

(2) 和 (3) 的 证 明 与 (1) 类 似 , 略 去 . 证 毕 . 

从 几何 上 看 ,用 oo 为 长 ` 短 轴 做 成 的 椭圆 是 所 有 椭圆 中 离 矩 阵 4 对 应 的 超 椭圆 
“距离 ?最近 的 ;如 果 使 用 ci 、oi、o; 为 轴 作 成 椭 球 体 , 则 得 到 所 有 椭 球 体 中 离 矩 阵 A 对 应 的 
超 椭圆 “距离 ”最 近 的 椭 球 体 …… 按 这 种 方式 ,第 7 步 之 后 ,就 得 到 了 4 的 全 部 信息 . 但 即 
使 执行 到 了 第 7 步 ,我 们 也 只 利用 了 7 十 nr 十 nr 二 (2n 十 Dr 个 数据 , 即 矩 阵 的 奇异 值 和 
对 应 的 左右 奇异 向 量 . 这 种 思想 可 应 用 于 图 像 压缩 和 泛 函 分 析 等 不 同 的 领域 之 中 . 

例 5.3.4 (基于 SVD 的 图 像 压缩 ) 如 图 5-6 所 示 , 对 于 一 幅 用 xm Xn 阶 的 像素 算 
阵 4 表示 的 图 像 ( 如 人 造 卫 星 的 大 部 分 图 片 为 512X512 像素 ,包含 262144 个 数据 ) ,如 
果 传 送 所 有 mm 个 数据 ,显然 数据 量 太 大 . 因此 我 们 希望 在 传输 之 前 ,对 数据 进行 压缩 ,这 
样 就 可 以 传送 少 一 些 的 数据 ,当然 在 接收 端 必须 能 够 重 构 原 图 像 . 如 果 我 们 从 和 矩阵 4 的 
SVD 中 选择 个 奇异 三 元 组 (oi ,wi,v) (i 二 1,2,…,k ) 来 通 近 原 图 像 , 即 用 (mx 十 n 十 


1)& 个 数据 代替 像素 矩阵 4. 那么 在 接收 端 ,可 得 A 二 2 ouwl. 由 于 4 4, 从 而 在 接 


收 端 可 近似 地 重 构 出 原 图 像 . 此 时 ,图像 的 压缩 比 为 = -加 5z， 其 倒数 称 为 图 像 


原始 图 像 k=3 


50 
100 100 
150 150 
Eh. 100 200 300 人 100 200 300 


100 200  ， 3o0 


图 5-6 SVD 图 像 压 缩 效 果 图 
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的 压缩 率 . 显然 ,实际 使 用 时 可 根据 不 同 的 需要 选择 适当 的 & 值 . 比如 图 5. 6 是 Matlab 
内 置 的 小 丑 图 形 (顺便 说 一 句 ,Matlab 中 隐藏 了 很 多 图 形 ) ,利用 下 列 代码 : 
load clown.mat; %clown 是 内 置 的 200 * 320 像素 的 图 像 
[U,S,V]= svd(X);colormap('gray'); k= 3; 
Xl= U(rLek)* S(Leklak})* V(: 7 二 3) "image (Xl) 
已 经 能 够 抽取 到 ”小丑 ”的 主要 特征 ,比如 鼻子 (图 5. 6(b)). 当 二 20 时 ,已 基本 能 够 重 构 原来 
的 图 像 ,此 时 传送 数据 (200 十 320 十 DX 20 = 10420 个 ,压缩 率 约 为 0.1628, 非常 之 低 . 
当然 ,要 特别 说 明 的 是 ,上 面 这 种 图 像 压缩 技术 并 不 是 一 种 特别 有 效 的 技术 . 事实 
上 , 英 勒 指出 ,他 的 研究 计算 机 图 像 处 理 的 朋友 将 这 种 方法 俏皮 地 称 为 image degradra- 
tion( 图 像 退 化 ). 
既然 讲 到 特征 抽取 ,我 们 不 能 不 指出 ,PCA 也 可 用 于 图 像 压缩 . 具体 算法 大 致 如 下 : 
先 使 用 PCA 方法 处 理 一 个 图 像 序列 ,提取 其 中 的 主 元 . 然后 根据 主 元 的 排序 去 除 其 中 次 
要 的 分 量 , 再 变换 回 原 空间 , 则 图 像 序列 因为 维 数 降 低 会 得 到 很 大 的 压缩 . 这 种 压缩 算法 
仍然 是 有 损 的 压缩 方法 ,但 同时 它 又 保持 了 其 中 最 “重要 ”的 信息 . 
我 们 不 能 不 对 SVD 与 PCA 做 些 比 较 . 事实 上 ,两 者 都 依赖 于 正 交 分 解 . 在 SVD 方 
法 中 用 以 求解 特征 值 问 题 的 矩阵 是 XX ,而 在 PCA 中 则 是 相关 甜 阵 R,. 由 于 R; 通常 无 


法 确定 ,因此 通常 用 样本 矩阵 构造 出 它 的 近似 二 XXT. 显然 ，lim 二 XXT 二 及 这 说 明 


SVD 与 PCA 间 存 在 渐进 关系 . 
在 SVD 的 基础 上 ,我们 可 以 构造 Ky Fan 范 数 . 
例 5.3.5 (Ky Fan 范 数 ) 设 和 矩阵 4AE 2 的 SVD 为 4=UBEBYVH ,上 且 4 的 奇异 值 为 


0 之 之 … 之 mm 过 0 


对 任意 1 三 & 达 nn, 令 


Gi(A) = a To 二 or (5. 3. 19) 
则 gx (4) 是 了 上 的 矩阵 范 数 , 称 为 Ky Fan k 范 数 , 记 为 |4|w. 


证 明 : 略 . 

显然 ,& = 二 工时 的 1 41 就 是 谱 范 数 1 41 ,上 一时 的 14 = tr (49A)3 就 是 和 矩 
阵 A 的 迹 范 数 (trace norm) 或 核 范 数 (nuclear norm ). 

定理 $. 3.6 (Ky Fan 优势 定理 ) 设 A,BE FY. 车 上 Alw 过 1Blw 对 k==1,2,…， 
2 都 成 立 , 则 对 任意 酉 不 变 范 数 | .| , 有 


141 入 18| (5. 3. 20) 
证 明 : 略 . 
5.3.4 只 要 醒 着 ,你 就 必须 思考 数学 


Ky Fan 何许 人 也 ? 他 就 是 与 华罗庚 、 陈 省 身 齐名 的 美 籍 华人 数学 家 樊 坊 ( 见 图 5 - 7). 
他 一 生发 表 学 术 论 文 140 篇 ,篇 篇 都 是 精品 ,被 引用 多 达 4 千 余 次 . 他 的 学 术 研 究 非 常 宽泛 ， 
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在 拓扑 群 ,. 非 线性 分 析 、 不 动 点 理论 . 凸 分 析 、 对 策 论 、 线 性 算 子 理论 .逼近 论 及 和 矩阵 论 等 方 
面 ,他 的 创造 已 成 为 这 些 分 支 的 经 典 与 基石 . 例如 德 布 鲁 (Gerard Debreu,1927 一 2004) 运 
用 Ky Fan 不 等 式 ,就 推导 出 一 系列 定理 ,并 因此 获得 1983 年 的 诺 贝 尔 经 济 学 奖 . 


| 
图 5-8 攀 协 学 生 设计 的 工 恤 衫 


图 5-7 反 坊 (1914 一 2010) 


攀 先 生 1932 年 考 入 北京 大 学 数学 系 ,7 年 后 通过 庚 款 留学 选拔 考试 , 赴 法 国 巴 黎 大 
学 , 师 从 大 数学 家 弗 雷 吹 (Maurice René Fréchet,1878 一 1973, 创 立 抽象 空间 理论 ,被 视 
为 泛 函 分 析 的 创始 人 ) 攻 读 抽 象 分 析 , 并 于 1941 年 获得 法 国 国家 博士 学 位 . 之 后 ,网 先生 
还 与 弗 雷 吹 合 著 了 法 文 版 的 (组合 拓扑 学 引 论 ) 一 书 , 影 响 很 大 . 

令 人 非常 同情 的 是 ,在 梦 先 生 留 法 期 间 , 尚 在 国内 的 三 个 幼子 突 染 急病 , 因 重 庆 战 时 
缺 医 少 药 ,无 法 救治 ,相继 天 折 . 攀 父 闻 讯 后 ,也 突 发 脑溢血 撒手 人 赛 . 痛 失 三 子 ,成 为 攀 
先生 永远 无 法 疗 傅 的 伤 痛 . 战 后 攀 先 生 转 赴 美 国 ,受到 大 数学 家 外 尔 和 冯 。 诺 依 曼 等 人 
的 影响 ,成 为 无 穷 维 空间 的 开路 先锋 和 终身 领袖 . 1965 年 , 圣 塔 共 芭 拉 加 州 大 学 (UCSB) 
特聘 他 为 该 校 的 数学 教授 . 

1985 年 暑假 ,UCSB 特意 为 他 举办 退休 纪念 活动 ,这 是 美国 数学 界 当 年 的 一 大 成 事 . 
在 活动 首 日 的 晚宴 上 ,一 位 创业 于 硅谷 的 学 生 的 “表演 ” 令 人 难忘 . 只 见 此 人 西装 革履 登 
台 , 随 讲 随 脱 , 脱 到 上 身 只 穿 一 件 工 恤 衫 时 ,宾主 哄 堂 大 笑 ,因为 衣服 上 印 着 一 行 字 :EVER- 
Y WAKING MOMENT( 见 图 5- 8). 原来 攀 先 生 每 当 新 学 期 开学 之 初 必 会 召集 全 系 研究 
生 开 会 “训话 ”“ 训 词 ” 中 常 说 的 就 是 “你 们 现在 已 经 是 职业 数学 家 了 ,只 要 醒 着 (Every 
Waking Moment) ,你 就 必须 思考 数学 !” 这 已 经 成 为 UCSB 数学 系 师 生 的 座右铭 , 代 代 
相传 . 

1989 年 , 久 离 故 国 的 樊 先生 终 于 回 到 他 已 上 膀 违 五 十 载 的 古都 北京 ,应 邀 回 国 讲 学 ,并 
把 他 半 个 世纪 的 藏书 全 部 捐献 给 了 北京 大 学 . 1999 年 ,他 又 捐赠 美国 数学 会 百 万 美元 ， 
设立 “罗氏 基金 会 ”, 旨 在 促进 与 资助 中 国 数学 家 与 世界 数学 家 的 交流 . 

“只 要 醒 着 ,你 就 必须 思考 数学 . "如今 先生 仙 逝 了 , 还 醒 着 的 我 们 ,是 不 是 应 该 承 其 
遗愿 ,多 多 地 思考 数学 问题 呢 ? 
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习 题 五 


设 x 二 (i, 一 2,3 十 4i,0)TE C", 求 | 上 xli, |x|; 和 x|。. 
设 了 是 赋 范 线性 空间 V 上 的 向 量 范 数 ,证 明 : 对 任意 ,BE V,， 有 
[fl 一 7 过 | 一 外 

设 如 ,ks 二 0 且 太 g 都 是 C" 上 的 向 量 范 数 , 则 下 一 max(CFg) 和 G 一 局 馈 g 都 
是 C” 上 的 向 量 范 数 . 

给 出 C” 中 分 别 满足 等 式 | xy 一 | 和 zl |y|。 和 |xiy| 二 |x | yl 的 向 量 x,y. 
用 图 形 描绘 出 展 ? 中 的 1 范 数 单位 球 、2 范 数 单位 球 和 oo 范 数 单位 球 . 
对 任意 x 二 = (Ziyzz… sya) 长 CE" 证 明 下 列 不 等 式 , 并 指 出 何 时 等 号 成 立 . 


1 
Dlxl, < lxl.< 1zl < lxl; 


lx < |x|; <vnalx|,; 

(3) | xl < vixT TxT;. 

对 任意 A 二 (ays) E EF” ,判断 FA) 二 m max |as | 是 否 为 FPF” 中 的 矩阵 范 数 . 
对 任意 A 二 (ay) GE 了， 证明 f(A4) = 上 A; 十 21A|; 是 FY 中 的 矩阵 范 数 . 


et ee 
已 知 4 一 | 1 1 2 , 求 |4], ,1Als, 1Al,,, 14 141: 到 141.. 
ee 


对 任意 A 二 (aj) EK, 设 det( 和 4) 了 关 0 且 4 为 A 的 任意 特征 值 , 则 对 ”YY 中 任意 
诱导 范 数 A , 有 
DAP < 1a< HAl; 1A = min jl 
zz0 xl 
设 A 二 (ay) € EF™", 则 对 ”中 任意 诱导 范 数 |4| , 有 41 三 |a;|. 
设 和 A= 二 (4;) € FY”, 设 det(4) 关 0, 证明: A477 .1Al, 宇 1. 
证 明 西 矩阵 的 2 范 数 等 于 1. 
证 明 :排列 矩阵 的 户 范 数 等 于 1, 对 角 和 矩阵 的 轧 范 数 是 其 对 角 元 的 最 大 模 . 
证 明 : 1A = Ali. 
对 任意 A 二 (ay) E YY , 设 r 二 xr(A). 证 明 下 列 不 等 式 : 


(D1al: < laAle <vrlal:; 2) 二 14l。< 14 < mlAl,; 


(3) 1Als 过 14 入 v 夺 14 a) mu EY 14|。<valal:; 
Vn Vm 


(5) 去 14l。< [Al; <vn|Al,; C6) 去 Al <|Al: <vmlAal;. 


设 A EF”Y, 则 对 ”中 任意 诱导 范 数 i ， 有 | 上 4 过 1A4l*,kE€EZ. 
(]) 证 明 : F””" 上 的 ms 范 数 与 下 上 的 oo 范 数 是 相 容 的 ; 


| 
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(2) 证 明 : F”* 上 的 mi 范 数 与 下 上 的 1 范 数 是 相 容 的 . 
对 任意 A 二 (a;) € FY ， 设 


f(A)=Vnrm*: max la|l,g(A)=max(mn). max |a;| 


1<i<m, 1<j<n 1<i<m 1<i<n 
(1) 证 明 : f 和 g 都 是 ”中 的 矩阵 范 数 ; 
(2) 证 明 : /与 向 量 的 2 范 数 相 容 ; 
(3) 证 明 : g 与 向 量 的 2 范 数 和 oo 范 数 都 是 相 容 的 . 
证 明 :任意 算 子 范 数 与 wo 范 数 等 价 , 即 对 任意 A GE F” 和 算 子 范 数 |4| , 都 存在 正 
数 c1 ,cs， 使 得 
alAl.<lAl< claAl, 


设 A Ek”Y, 证明; p(4) 不 是 FY 中 的 矩阵 范 数 . 

设 A EF, 证 明 : 上 14|i 14 .141。,kE 了 Z. 

对 半 酉 适 阵 U,V. 证 明 : 上 UAV|; = 二 14l1; 及 |UAvV|s = |4ls. 

(外 积 的 范 数 ) 对 任意 x E C”,y € C", 证明: 

GD)| zy = |xl;|y|;; 

Dxy | 一 人. 

设 A,B ER， 证明 : 短 阵 的 下 范 数 和 2 范 数 是 相 容 的 , 即 
14B 人 过 141z181， 14AB1 <1Al: BI|: 


(和 矩阵 的 正规 偏离 度 ) 对 任意 A 二 (aj) € FY, 设 和 ,hs，…,A, 为 的 特征 值 . 
(DD) 证 明 : >) |4.|? 过 p> 
i=1 


i=1 j= 


dj |*， 等 号 成 立 当 且 仅 当 A 为 正规 矩阵 ; 


(2) 解 释 度 量 ApA 一 p93 一 六 的 作用 ， 
x |4x | ax | 和 | 


日 = Ee a 
证 明 k(A) 一 pT 特别 地 , 当 A 是 正规 适 阵 时 ,js (A) E ry 
这 里 ma on 分 别 是 A We 
1 (4) -一 二 名 (4) 
证 明 ;(1) 一 a <n; (2) 二 芝 本 0 
Me RR 


(]) 证 明 : 对 任意 矩阵 A 二 (aj) € F* ,|4|， Sn max ||; 


i 


(2) 对 矩阵 A 二 | ,0 之 e 安 1 汀 用 (1) 的 结论 信 计 (CA) 
E 
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虽然 在 微 积分 的 开端 时 期 ,无穷小 被 神学 家 嘲讽 为 “上 帝 的 幽灵 ”, 并 引发 了 “第 二 次 
数学 危机 ”, 直到 “实数 理论 ”的 出 现 , 这 场 危 机 才 算 彻底 解决 . 但 微 积 分 自 诞 生起 在 近代 
社会 所 起 的 巨大 作用 ,我 们 早已 深 有 体会 . 将 微 积分 中 的 极限 导数 、 积 分 、 级 数 、 方 程 等 
分 析 学 的 思想 和 方法 与 矩阵 相 结 合 ,如 此 “ 强 强 联合 ”, 将 更 是 威力 无 比 . 在 范 数 理论 中 ， 
我 们 就 已 初步 见识 到 这 种 威力 . 事实 上 ,矩阵 分 析 论 .空间 与 变换 以 及 矩阵 分 解 论 是 矩阵 
理论 中 的 三 大 基础 知识 板块 . 


微 积分 的 基础 是 实数 理论 ,但 就 一 般 读者 的 学 习 经 验 而 言 , 则 是 数列 极限 的 收敛 理 
论 及 其 衍生 的 级 数理 论 . 这 方面 的 知识 读者 可 参考 文献 L441. 当 我 们 将 矩阵 看 成 一 个 " 超 
数 ” 时 ,类 比 可 得 矩阵 序列 与 矩阵 级 数 . 问题 是 我 们 需要 度量 两 个 “ 超 数 ” 之 间 的 接近 程 
度 , 这 样 的 度量 工具 就 是 前 面 的 范 数 . 尽管 使 用 坐标 也 可 以 描述 两 个 矩阵 的 接近 程度 ,但 
使 用 范 数 记号 ,明显 简洁 明晰 ,而 且 非 常 有 助 于 思维 和 证 明 . 


6.1.1 矩阵 序列 


定义 6.1.1 设 有 ”中 的 矩阵 序列 (matrix sequence) 
{A} 0 Ai ,A» 四 
这 里 A 一 〈a 多 )ww。 如 果 每 个 数列 {a ) 都 收敛 , 即 有 


lima 一 0 (2 1 ,29° 57037 et 1y2 yw ,1) 


则 称 和 矩阵 序列 {A } 收敛 于 极限 (convergent to limit) 4 二 (a; ) ww , 记 为 dim = 
否则 就 称 矩 阵 序列 {A ) 是 发 散 的 (divergent). 

类 比 微 积分 中 的 数列 极限 和 函数 极限 的 性 质 , 根 据 定义 6. 1.1, 可 证 明 下 列 性 质 . 

定理 6. 1. 1( 线 性 运算 ) 设 ”中 的 矩阵 序列 {A4}) , {Bi) 分 别 收敛 于 4,B E FY , 则 
对 任意 X E 下 ,矩阵 序列 {4 十 及 上 ， {X44} 分 别 收 敛 于 A 土 B ,XA，, 即 


kt 大 oo 


定理 6. 1. 2( 乘 法 运算 ) 设 Fr”? 中 的 矩阵 序列 {Ai } 收敛 于 4 € F”?, F** 中 的 矩阵 
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序列 {B) 收敛 于 B € Fr*”, 则 和 矩阵 序列 {A B) 收敛 于 AB, 即 lim At B 一 AB. 
推论 6.1.1 设 lim A = A E EP”™, 则 对 任意 常数 矩阵 PE F** 和 Q E FEF”%, 恒 有 


lim(P4,O) = PAO 
人 oo 
定理 6.1.3 〈 逆 运算 ) 设 Jim As 一 4EE”, 且 4 和 所 有 的 4 都 可 逆 , 则 
lim (A, 和 be A 
人 -oo 


特别 要 注意 在 定理 6. 1. 3 中 ,条 件 “ 4 可逆 ? 必 不 可 少 . 例如 和 矩阵 序列 


“= 作出 


1 1 

虽然 Ai 者 可逆 且 {44) 收敛 于 4 一 {  ] ), 但 显然 矩阵 4 不 可 首 

Matlab 中 提供 了 内 置 函 数 limit 可 用 于 计算 矩阵 序列 的 极限 ,调用 格式 为 

syms k; A= limit (Ak, k, inf) % 声明 符号 变量 k, 再 调用 符号 计算 函数 limit 
其 中 ,矩阵 44 必须 给 出 每 个 元 素 的 通 项 公式 . 

在 微 积分 中 ,数列 {a, } 收敛 于 a 即 limas 一 a 可 改写 为 lim(as 一 a) 一 0, 也 就 是 
lim|a 一 a| 二 0. 这 个 想法 可 类 比 到 和 矩阵 序列 ,只 要 将 其 中 的 绝对 值 一 般 化 为 矩阵 
范 数 . 

定理 6.1.4 FF” 中 的 矩阵 序列 {A ) 收 合 于 A € Fr” 的 充 要 条 件 是 对 任意 一 种 矩 
阵 范 数 | | , 都 有 lim1A4 一 A1= 0. 

特别 地 ,车 A 二 0, 则 lim 4, = 0 的 充 要 条 件 是 lim |4i| = 0. 

证 明 : 设 4 三 二 (Cg 的 Da A= (Qs D ii (z =3 1 ,e737 = 1,**,n) , 则 | 


lim 4 = AS lima® = aj;S lim(a® —a;)=0 
kt k=tw kt 


m n 


> [a —ay |? 一 0 全 lim|A:—Al:=0 
1 大 -oo 


S limy > > 
由 范 数 的 等 价 性 可 知 , 对 于 FP” 上 任意 一 种 矩阵 范 数 | "||, 必 存 在 正常 数 co .cz , 使 
ch 一 4 上 和 4 一 4 入 c14 一 4 
再 由 数列 极限 的 三 明治 定理 即 来 逼 定理 ,可 得 
limlAs —Als = 0 liml4 —Al=0 
所 以 lim A = 4S lim144 一 4| = 0. 证 毕 . 


定义 6.1.2 设 有 FF”” 中 的 矩阵 序列 (4) 和 和 矩阵 A, 如 果 对 任意 一 种 矩阵 范 数 
| .1 ,都 有 


lim|A; —A|=0 
大 -oo 
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则 称 和 矩阵 序列 (As) 收敛 于 A, 记 为 lim A 三 A. 否则 称 和 矩阵 序列 {A } 是 发 散 的 . 

显然 ,定义 6. 1. 1 与 定义 6. 1. 2 是 等 价 的 ,前 者 称 为 依 元 素 收敛 或 依 坐 标 收敛 
(pointwise convengence) ,后 者 则 称 为 依 范 数 收敛 (normal convengence). 前 者 从 微观 或 
元 素 的 层面 将 矩阵 看 成 “一 堆 数 ”, 拘 泥 或 纠缠 于 细 枝 未 节 ; 后 者 则 从 宏观 的 符号 层面 将 
矩阵 看 成 一 个 “完全 的 抽象 物 ”, 即 一 个 具有 某 些 指定 运算 的 数学 对 象 或 " 算 子 ”“ 术 语 或 
符号 的 引入 ,往往 是 为 了 理论 的 易于 表达 和 解决 问题 . 特别 是 在 数学 中 ,只 要 细 加 分 析 ， 
即 可 发 现 符号 化 给 数学 理论 的 表述 和 论证 带 来 极 大 的 方便 . ”怀特 海 ) 显 然 , 范 数 这 个 
“术语 或 符号 ?就 具有 这 样 的 威力 . 因此 用 矩阵 的 范 数 理论 来 研究 矩阵 序列 的 收敛 性 是 矩 
阵 分 析 中 最 常用 、 最 简洁 的 方法 . 当然 ,实际 使 用 时 ,我 们 的 思维 可 以 根据 问题 的 需要 在 
这 两 个 层面 间 灵 活 切 换 . 

向 量 是 特殊 的 矩阵 ,上 述 结论 自 然 对 向 量 也 成 立 ， 

定理 6.1.5 中 的 向 量 序 列 {xz”} 收敛 于 zx" 的 充 要 条 件 是 对 任意 一 种 向 量 范 数 
| .1 ,都 有 


limlx® —x*|=0 
人 -oo 


下 面 我 们 来 考察 如 何 判断 矩阵 序列 的 敛 散 性 . 我 们 仍然 采用 类 比 思维 ,从 数列 极限 
人 手 . 

等 比 数列 {g”) 是 最 常见 的 一 种 数列 ,类似 地 ,最 常见 的 矩阵 序列 是 方 阵 的 寡 构 成 的 
和 矩阵 序列 {A*), 即 4 一 A*. 联想 到 等 比 数列 {g"} 收敛 于 0 的 充 要 条 件 是 1g| 二 1, 类 
似 地 ，{A*} 收敛 于 O 的 充 要 条 件 似乎 应 该 是 eA 二 1. 这 个 想法 是 否 正确 呢 ? 

以 A = 二 diag(N1 hz) 来 分 析 . 由 于 A* 二 diag(X, 汉 ), 因此 limA" 二 0 等 价 于 limat 
二 limX$ 一 0, 即 矩 阵 4 的 特征 值 M, (i 二 1,2) 的 模 都 小 于 1, 此 即 p(4) 二 1. 充 要 条 件 
居然 不 是 s4 二 1, 而 是 计算 更 复杂 的 p(4) 二 1, 引入 谱 半 径 的 意义 至 少 在 这 里 露出 
端倪 . 

定义 6.1.3 如 果 lim A 二 0, 即 {4} 收敛 于 零 矩 阵 O, 则 称 和 矩阵 4 是 收敛 矩阵 
(convergent matrix). 否则 称 和 矩阵 4 为 发 散 和 矩阵 (divergent matrix). 

定理 6.1.5 了 ”中 的 矩阵 4 是 收敛 矩阵 的 充 要 条 件 是 其 谱 半 径 小 于 1, 即 oC4) 一 1. 

证 明 : 设 矩阵 4 的 Jordan 分 解 为 4 二 PJP"1', 这 里 = diag(Ch OO ) ,万 (os)，…， 
Js)), 则 4 三 PP1P ,从 而 由 推论 6.1.1 和 式 (2. 6.6) 可 知 


lim A* = O03 lim ff* = O08 lim J,*(;) = O00(i = 1,2,.…%,s) 
kt kt k=to 


戏 CAE! « OnaAfet! 
pi 
S lim Ca 二 O 〇 (其 中 1 家 时 规定 Ct = 0) 
对 


S limX = 03IN|<1Sp(4) = max|h|<1 
证 毕 . 
谱 半径 不 易 计 算 , 但 注意 到 谱 半 径 不 超过 任何 一 种 矩阵 范 数 ,因此 实际 中 常用 矩阵 
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范 数 来 判断 矩阵 是 否 是 收敛 矩阵 . 只 有 当 很 难 找到 这 样 的 矩阵 范 数 时 ,我 们 才 计 算出 矩 
阵 的 所 有 特征 值 , 进 而 得 到 谱 半 径 . 

定理 6.1.6 屯 ” 中 的 矩阵 4 是 收敛 矩阵 的 充分 条 件 是 存在 一 种 矩阵 范 数 ,使 得 
PC4) 到 1， 

证 明 : 由 于 pC(4) 达 yg(4), 而 yg(4) 二 1, 因此 po(C4) 二 1. 根据 定理 6. 1. 5, 结 论 成 立 . 
证 毕 . 

作为 计算 简易 的 代价 ,对 于 范 数 都 不 小 于 1 的 矩阵 ,使 用 范 数 无 法 判断 其 敛 散 性 . 

例 6.1.1 判断 下 列 矩 阵 A 是 否 为 收敛 矩阵 ,其 中 
一 1 1 0 
一 4 3 0 

区 

解 :(1) 4 的 特征 值 为 0.3 十 0. 和 4 和 一 0.8, 故 o(4) 一 max(0.5,0.8) 一 0.8 一 1, 由 
定理 6.1.5 可 知 A 是 收敛 矩阵 . 

(2) 例 2. 5. 1 中 已 算出 4 的 特征 值 为 2,1,1, 所 以 p(4) = 2 二 1, 4 是 发 散 和 矩阵 . 

(3) 注 意 到 虽然 14 外 = 1.1, 但 是 有 14|。= 0.9, 根据 定理 6. 1. 6 可 知 4 是 收敛 
和 矩阵 . 


0.3 十 0.4: 1 


e 0.6 0.2 
A= |( ) 
0 一 0.8 


这 二 tne a 


2 


2 
例 6.1.2 已 知 矩 阵 A = 2|, 入 态 = 一 省- 让, 过 lim BB 
] oA) hro0 


2 
L 
2 
的 特征 值 分 解 为 4 二 PAP ,其 中 


= 
1 1 0 


1 站 1 


了 
2 
2 

解 : 4 是 对 称 和 矩阵 ,计算 可 知 4 


A= diag(5,—1,—1),P= 


显然 po(4) 二 5, 并且 B= R= PDP- ,其 中 DD == diag(1, 一 0.2, 一 0.2), 因此 
有 = diag[ 1,( 一 0.2)*,( 一 0.2)*], 从 而 


lim B* = limPD*P™ = P(impDe )P- 
k=% 人 -oo 到-oo 


Le 1 =1 = 
0 1 1 0 
Qll 0 J 


= -和 
1 

1 0 0 1 三” 于 
二 se = 
et. 
1 0 0 


0 1 
se tt 治 


1 
1 
1 


本 题 使 用 Matlab 来 计算 的 代码 如 下 : 
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syms k;A= [122;212;221];[P,D]= eig (A); 
r= vrho (A); D= D/r; ”% 计 算 谱 半 径 r, 并 将 了 D 更 新 为 B 的 谱 分 解 的 对 角 和 矩阵 
Dk= D^k”% 进 行 符号 计算 时 只 有 对 角 和 矩阵 可 使 用 和 宕 运 算 符 ” 
LB= P* limit (Dk,k,inf)* P^(- 1) 
当 |g| 二 1 时 , 公 比 |o|= -从 证 刻画 了 等 比 数列 {gq') 收敛 于 0 的 收敛 速率 ,类 
似 地 ,对 收敛 矩阵 4, 其 上 A* 收敛 于 O 的 收敛 速率 (convergence rate) 可 以 通过 r = 


| (为 什么 不 是 谱 半 径 ?) 来 加 以 刻画 . 下 面 我 们 给 出 刻 划 这 种 渐 近 行为 的 一 个 基 


lim 
=» AT 


本 结论 
定理 6.1.7 设 4E FF”X 且 e 放 0. 则 对 任意 矩阵 范 数 | .| , 存在 正 数 c1 (依赖 于 所 
用 范 数 ) 和 cs = c (4,e) (依赖 于 使 用 的 范 数 , 和 矩阵 A 及 e ) ,使 得 


cip (A)* Z|ANS es pA) te) (6. 1.1) 
证 明 : 设 (4,z) 为 矩阵 4 的 优势 特征 对 且 xl: = 1, 则 

|A*x|, = [Xxl, = |4|* = p (A)* 
因此 |4*| = Axl; 宇 o (4)* 根据 矩阵 范 数 的 相 容 性 ,存在 常数 c 二 0， 

使 得 
14| 兰 c441。 > cp (4)* 
另外 , 令 p(4) 为 某 种 相 容 矩阵 范 数 , 且 p(4) 之 pC4) 十 s, 则 由 习题 5. 17 可 知 
pA) Zp A) < (ph) +e)’ 

同样 ,根据 范 数 相 容 性 可 知 , 存 在 常数 co 二 cx (4,s) > 0, 使 得 

|A*|<< cap (A!) < cs (pA) 十 e) 


证 毕 . 
显然 定理 6. 1. 7 指出 和 矩阵 4 的 寡 4* 本 质 上 是 以 p (4)* 的 规模 增 大 或 收缩 的 . 以 矩阵 
4 二 J(0.5) 为 例 , 其 谱 半 径 0(4) = 广 ， 显然 4 = 几 (0. 5) = 包 po 


1A*|,= 2*(1 二 2k) 


AtH| 3 十 中 1 


性 a 
IA*| 20+2k) 2 1 十 2 
jmlA™m|_ 1 

六 二 lim jar 3 


即 oC4) < 过 pC4) 十 e 且 7 二 p(4). 这 个 不 等 式 之 所 以 如 此 简单 ,是 因为 此 时 的 优 


势 特征 值 4 一 0. 5 是 亏损 特征 值 . 经 过 10 次 迁 代 , 收 全 速率 -从 二 1 时 的 号 迅速 降 到 
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一 10 时 的 号 ,已 经 非常 接近 p(4)， 误差 不 到 0. 05. 因此 收敛 速率 本 质 上 是 渐 近 地 接 近 


6.1.2 矩阵 级 数 


我 们 知道 ,数列 {a,} 的 所 有 项 的 和 构成 级 数 Da, 由 此 衍生 出 的 级 数理 论 是 微 积 


分 的 基础 理论 ,其 中 的 许多 概念 和 结论 大 都 能 推广 到 和 矩阵 序列 {A }. 
定义 6.1.4 设 有 了” 中 的 矩阵 序列 {4 ), 则 称 


> 4 一 4 十 4 十 … 十 4 十 … 


k=1 


为 矩阵 级 数 Cmatrix series). 如 果 2 A 的 部 分 和 序列 {S }》 收敛 于 矩阵 $, 这 里 


Si 一 4 十 4 十 … 十 4 
则 称 矩 阵 级 数 > 4x 收 么 于 $, 或 > Ai 的 和 (sum) 为 $, 记 为 > 4, = S. 
&=1 k=1 & 一 1 


显然 ,矩阵 级 数 >\ A, 收敛 于 $ 时 ,矩阵 序列 (Ai) 收 伍 于 O, 即 lim4, 一 0, 这 是 因 
k=1 0 


为 & 一 wo 时 Ai 二 Si 一 Si 一 S$ 一 S$ 一 O 这 个 结果 显然 与 数 项 级 数 中 的 情形 完全 一 致 . 
由 定义 6.1.4 可 以 推出 下 列 性 质 : 


(D 设 Fw 中 的 矩阵 级 数 > A4，》) B, 分 别 收敛 于 S,TE Row"， 则 对 任意 E F, 有 


2 (4 士 到) 一 S 士 T， > 4 一 5 
k=1 k=1 


(2) 设 2 A = SE FY, 则 对 任意 常 秆 阵 PE F*” 和 QE Po , 有 > PAO = PSO. 
k=]1 k=1 


证 明 : 仅 给 出 (2) 的 证 明 , 其 他 类 似 . 
利用 定义 6. 1. 4 和 推论 6. 1. 1 可知 


n> m0 ~ inp 400 = Poin» 40 = P50 
因此 > PA1Q = PSQ. 证 毕 . 
由 定义 6. 1. 4 还 可 推出 矩阵 级 数 在 矩阵 与 元 素 两 层面 间 的 转换 关系 , 即 Pr” 中 的 矩阵 
级 数 > A 收敛 于 $ 的 充 要 条 件 是 所 有 wo 个 数 项 级 数 ago 都 收 全 于 相应 的 8 , 其 中 


Ai = (lap), S= (5) (=120m3) 二 1 2 
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= 3 
2 和 1 A oo 
例 6.1.3 已 知 A 一 , 求 >， A 的 和 . 
k=1 
9 
解 :显然 从 元 素 层面 人 手 较 简单 , 即 
二 TY Bx 
和 2 we 之 ， 4 2 x 
2 4: = 3 
FE 了 OQ 1 


从 元 素 层面 ,也 可 以 将 数 项 级 数 的 绝对 收敛 推广 到 矩阵 级 数 . 

定义 6.1.5 对 于 Jr” 中 的 矩阵 级 数 》' Ai, 这 里 A = (ap ) Gi 二 1,2,…,m;j = 

1,2,…,n) ,如 果 所 有 wm 个 数 项 级 数 > ago 都 绝对 收敛 , 则 称 和 矩阵 级 数 》) A 绝对 收 合 
k=1 k=1 


(absolutely convergent). 
在 微 积分 中 , 数 项 级 数 敛 散 性 的 判定 大 都 转化 为 判定 正 项 级 数 的 敛 散 性 ,与 之 类 似 ， 
判定 矩阵 级 数 是 否 绝对 收敛 也 可 借助 范 数 理论 转化 为 判定 正 项 级 数 的 敛 散 性 . 


定理 6.1.8 FF” 中 的 矩阵 级 数 > A 绝对 收敛 的 充 要 条 件 是 是 正 项 级 数 | as| 收 
敛 , 这 里 的 矩阵 范 数 是 任意 的 . 
证 明 : 必 要 性 . 若 矩 阵 级 数 > Ai 绝对 收敛 ,这 里 Ai 二 (a) E FY (i= 1 7703; 


让 二 1,… ， 则 正 项 级 数 > "| at | 都 收 化 ,收敛 必 有 界 , 故 存在 M, , 使 得 3 1a | 二 
k=1 类 一 1 
M;， 从 而 


Bad, = DPD)< mm 
其 中 ， M = maxM。 所 以 正 项 级 数 14 收 全 ,由 短 阵 范 数 的 等 价 性 可 知 ,对 任意 
短 阵 范 数 , 正 项 级 数 > 14,| 都 收 全 
充分 性 . 若 对 任意 抵 阵 范 数 , 正 项 级 数 > 14,| 都 收敛, 则 正 项 级 数 > 14, | 。 也 收 
全 | 故 ap | 二 补 Ja | = 14ak|。. 根据 正 项 级 数 的 比较 判别 法 ,“ 大 敛 则 小 敛 ”所 


以 正 项 级 数 > |a 多 | 也 收 剑 , 即 正 项 级 数 a 多 绝对 收 敏 ,由 定义 可 知 ,矩阵 级 数 》 


4 绝对 收敛 .证 毕 . 
微 积分 及 复 变 函数 的 级 数理 论 中 ,最 重要 的 考级 数理 论 也 可 推广 到 和 矩阵 . 
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思考 : 寡 级 数理 论 的 重要 性 体现 在 何 处 ? 
定义 6.1.6 关中 的 矩阵 级 数 


> ch = col+aA+c A 十 十 ch 十 … 


称 为 矩阵 4 的 寡 级 数 ,简称 和 矩阵 需 级 数 (matrix power series) ,这 里 ce GE 下 
注意 :只 有 方 阵 才 有 和 矩阵 窜 级 数 . 


复 变量 z 的 震级 数 Pare! 显然 是 实 变量 x 的 寡 级 数 Dart 的 推广 , 即 后 者 可 视 为 


前 者 的 特殊 情形 . 判断 仇 散 性 时 ， 两 者 常 使 用 的 都 是 收敛 半径 ， 而 且 前 者 的 收敛 圆 与 实 轴 
的 交集 显然 就 是 后 者 的 收敛 区 间 . 矩阵 寄 级 数 则 是 两 者 的 进一步 推广 . 因此 讨论 矩阵 贿 
级 数 的 敛 散 性 问题 自然 就 与 复 变 量 的 震级 数 的 敛 散 性 问题 联系 起 来 ,并 且 使 用 的 工具 也 
应 该 是 与 收敛 半径 对 应 的 谱 半径 . 


定理 6.1.9 设 了 上 的 震级 数 cet 的 收敛 半径 为 R, 则 对 矩阵 4 E FP” 的 震级 数 


ch4, 当 p(A) 二 RR 时 ycA4 绝 对 收 伍 ; 当 p(CA) 二 尽 时 > cuA4 发 散 ; 当 oC4A) 一 RR 时 
k=1 k=0 k=0 
这 里 无 法 判断 . 

证 明 : 设 oC(4) 二 R, 则 存在 正 数 es 之 0, 使 得 po(A4) 十 e 二 R. 由 定理 5. 3. 2 可 知 ,存在 
KE” 上 的 相 容 和 矩阵 范 数 (4)， 使 得 2p(4) 委 po(C4) 十 s 志 尺 , 于 是 


OypcA) Z|alp Ah) < |aly (A) < | cx | Cp(A) 十 6 


因为 oC4) 十 se € (一 R,R), 所 以 > [cx Cp(4) 十 e)* 绝对 收敛 ,绝对 收敛 必 收敛 , 故 


之 |c| (CoCA) 十 e 六 也 收敛 ,于 是 由 “大 敛 则 小 但 可知 正 项 级 数 DlaA’ ) 收敛 , 故 


8 


2290A) 绝对 收敛 . 再 由 定理 6. 1. 8 可 知 > “A* 绝对 收敛 


。 当 p(4) 之 RR 时 , 设 答 阵 4 的 特征 值 为 ,A ，…,N， 则 必 有 某 个 特征 值 满足 | | 之 民 
Ai ki 


; A i 
设 A 的 Jordan 分 解 为 A = PP"! 9 这 里 J == ba 9 其 中 ki ,°°* ,ki = 0 或 1. 
nl 


pp 
注意 到 A* 二 PJ*P7', 因此 Daa 二 SaPJxP-: 一 pCO eT)P. 因为 的 对 
角 元 为 省 (i 一 1,2,…,n ), 故 箱 阵 备 级 数 > cnJ* 的 对 角 元 为 > ca4 , 其 中 某 个 > out 
是 发 散 的 ,所 以 了 coJ* 是 发 散 的 ,从 而 可 知 cA* 也 发 散 .证 毕 . 


注意 , 当 p(4) 一 尽 时 ，》 oA* 的 倒 散 性 不 能 用 定理 6. 1.9 来 判定 ,但 可 以 使 用 其 他 
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方法 . 
推论 6.1.2 设 下 上 的 宕 级 数 > cs’ 的 收敛 半径 为 m, 即 > cuz* 处 处 绝对 收敛 ,出 
对 Br” 中 的 任意 矩阵 4, 矩阵 智 级 数 > cxh+ 也 “处 处 "绝对 收 化 


例 6.1.4 判断 下 列 矩阵 震级 数 > cu4+ 的 敛 散 性 


0.3 0.5 
人 ee sat 
人 ms = (0 1) 
a =atia=(, ») 


解 :(1) 级 数 》' zx 的 收敛 半径 为 R 二 1, 而 14 = 0.9 一 R, 因此 po) 之 4141 二 
R, 故 该 级 数 收 化 ， 

(2) 了 本 二 5 的 收 全 半径 为 R 二 1, 但 4 的 特征 什 为 1,1, 即 p(4) 一 1 一 R, 不 
能 使 用 定理 6. 1. 9. 注意 到 此 时 ， 


尽管 级 数 > 去 收敛 ,但 调和 级 数 》 二 却 是 发 散 的 ,因此 > AI 一 六 二- 
> 吉 发 散 ,从 而 原 级 数 也 发 散 
“3 > 4 的 收敛 半径 为 R 二 1, 且 p(4) = 1 二 RR, 仍然 不 能 使 用 定理 6. 1.9. 


A 的 Jordan 分 解 为 4 = 二 PJP-, 其 中 = ( 一 ) ;因此 


0 


由 于 
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£=1 k=1 k=1 


oy (一 1) 生 1 


0 
k=1 k 


区 布 尼 兹 级 数 >) (一 臣 一 收 全 ,但 级 数 > (一 1)* 却 改 散 , 因此 > 十 1 发散, 从 而 


十 
最 后 讨论 最 特殊 的 矩阵 适 级 数 , 即 Neumann 级 数 


[Ms 


A 一 了 十 A 十 入 十 … 十 A 十 … 


~ 
1 


0 


由 于 复 变量 震级 数 > x 的 收 全 半径 是 1, 并且 收 敛 于 (1 一 =) 与 矩阵 类 比 , 并 结 
合 定理 6. 1. 5 和 定理 6. 1. 9, 可 得 下 列 结论 . 

定理 6.1. 10 FY 上 的 Neumann 级 数 收敛 于 CI 一 4 人) 的 充 要 条 件 是 p(4) 一 1. 

证 明 : 充 要 性 的 证 明 留 作 练习 . 这 里 只 证 Neumann 级 数 收 敛 于 (I 一 A)7. 

设 4 为 4 的 特征 值 , 则 1 一 4 为 I 一 4 的 特征 值 ,因为 pC(4) 二 1, 所 以 |4| 志 1, 此 即 
1 一 A € (0,2), 因此 矩阵 二 -4 可逆 ,并 且 limat 一 0 令 S 一 了 1A', S, == FA, 则 S, (I 

La k=0 k=0 

一 A) 二 1 一 A”, 从 而 $5 二 (1 一 A)" 一 A” (I 一 A)7 ,两边 令 mm-> oo 即 得 


S 一 lim Sv 一 (I—A) '— lim A” (I—A) := (I—A)'—O(—A)! 
= (I—A)'! 
证 毕 . 
定理 6.1.11 设 上 .| 为 FrY” 上 满足 上 了 |= 1 的 相 容 矩阵 范 数 ,如 果 对 于 矩阵 A EF 
成立 上 4 一 1, 则 有 误差 估计 式 


ml 说 
| ez 一 4 一 A [< 


证 明 :由 于 po(4) 之 141 , 由 题 知 pcC4) 过 4141 二 1, 因此 Neumann 级 数 收 敛 ,从 而 
GA TA= 
k=0 k=m k=0 
两 边 取 范 数 ,并 利用 定理 5. 3. 3 和 矩阵 范 数 的 相 容 性 , 即 得 


ml 
|a-a7 — >a|< 14"1 Aanl< la oo 
k=0 1 一 |4| 


证 毕 . 
例 6.1.5 ”判断 下 列 矩 阵 寡 级 数 收敛 并 求 出 其 和 . 


2 0.2 0.3 
站 Sioa 其 中 二 14 让 三 ( 
k=0 


. k 和 
0.7 DC oA 其 中 k, A 同 (1). 
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解 :(1) 显 然 4 的 谱 半 径 pC(4) 过 14 = 0.9 二 1, 因此 和 矩阵 宕 级 数 A 收敛 ， 
并 且 


g 4 3 
DM: 二 (1 一 4) 一 贡 
k=0 117 8 


光 dd —b 
注意 ,可 使 用 “两 调 一 除 公式 ”(《“) = 二 上 元 (“。 。 ) 来 求 二 阶 错 阵 的 适 
矩阵 
(2) 级 数 > "hr* 的 收 全 半径 是 R 一 1, PC) 之 1 一 R, 故 Db! 收 全 


由 于 DE 二 (1 一 Zz)-1, 两 边 求 导 , 得 by 一 (1 一 z) 一 , 故 


kr*!=z (zx) 


SN 
[Ms 


k 


人 一 1 


1 


326 327 
这 =: | 
从 而 > AC(I— AY™ = 项 (7 a 


Matlab 提供 了 内 置 函数 symsum, 可 用 于 求 级 数 的 和 以 及 部 分 和 . 调用 格式 分 别 为 
symsum(S),symsum(S,v),symsum(S,a,b),symsum(S,v,a,b), 


其 中 , 自 变量 v 可 由 内 置 变量 symvar 缺 省 指定 ,b 可 取 整 数 或 inf,a、b 同时 缺 省 时 求 和 区 
间 为 [0,v 一 1j. 但 当 S 是 和 矩 阵 时 , 求 和 是 按 元 素 进 行 的 ,因此 必须 明确 给 出 每 个 元 素 的 通 
项 公式 . 

卡尔 。 诺 依 曼 (Carl Neumann,1832 一 1935) 是 非常 容易 被 混淆 为 计算 机 之 父 汉 ， 诺 
依 曼 的 数学 家 . 他 出 生 于 以 “七 桥 问题 > 闻名 世界 的 哥 尼 斯 堡 ,父亲 弗 朗 蒋 。 诺 依 曼 
(Franz Neumann, 1798 一 1895) 是 哥 尼 斯 堡 大 学 的 物理 学 教授 . 1855 年 获 哥 尼斯 堡 大 学 
博士 学 位 后 ,他 轧 转 多 地 ,最 终于 1868 年 任职 于 莱比锡 大 学 ,直至 退休 . 他 的 研究 领域 涉 
及 数学 物理 \ 位 势 论 、 电 动力 学 等 应 用 数学 领域 . 以 他 的 名 字 命 名 的 Neumann 级 数 , 是 他 
在 1877 年 提出 的 ,对 研究 有 界 算 子 的 谱 理论 非常 有 帮助 . 


6.2 解 线性 方程 组 的 古典 迭代 法 


和 矩阵 分 解 从 乘法 入 手 , 把 一 个 矩阵 分 解 为 几 个 特殊 矩阵 因子 的 乘积 ,而 矩阵 分 裂 则 
从 加 法 入 手 , 把 一 个 矩阵 分 裂 为 几 个 特殊 矩阵 之 和 . 两 者 的 手段 都 是 将 一 般 矩阵 变 成 特 
殊 和 矩阵. 在 本 节 中 ,我 们 基于 矩阵 分 裂 技 术 ,构造 了 三 种 古典 迭代 法 . 


6.2.1 三 种 基本 迭代 法 
考虑 线性 方程 组 
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4Zxi 十 Xs = 5 
2Z1 二 4x2 十 天 5 SE, 6 (6. 2 JJ) 
Z2 十 4za 一 5 


显然 精确 解 为 x 二 (zi,z2,z3)" 二 (1,1,1)". 为 了 构造 形 如 式 (1. 4. 1) 的 迭代 格式 ， 
我 们 必须 把 变量 zi ,zz ,zs 分 别 从 三 个 方程 中 分 离 出 来 ,也 就 是 


1 = 一 地 zx 十 立 
TX2 a 一 二 十 于 
By 一 一 于 之 十 卫 


这 样 就 可 以 构造 出 如 下 的 迭代 格式 : 


5 
ztD 一 一 于 z 风 站 
jz ,12 ) (06.2.2) 
2 4 1 4 3 4 9 二 9C9 。C 
mt 一 一 地 x 多 十 


其 中 , x ”一 (zf ,zj ,zi2)7 是 任意 给 定 的 初始 向 量 (initial vector). 这 样 在 迭代 格式 
(6. 2. 2) 中 ,依次 令 & 王 0,1,2,…, 便 得 到 一 个 向 量 序列 {x ). 理论 上 ,车 存在 x” = 
(xz? ,Ti ,73 ) 满足 limx” 二 x*，, 则 x" 就 是 原 方程 组 的 解 . 这 样 通过 迭代 格式 (6. 2. 2) 
逐步 台 近 x” 的 过 程 就 称 为 Jacobi 迭代 . 

将 上 述 过 程 一 般 化 ， 考虑 线性 方程 组 Ax 一 0， 其 中 A= (ar Di b= (Dh ,bs ,bs 
显然 其 与 式 (6. 2. 2) 对 应 的 迭代 格式 为 


n 


1 1 S 
IHD 一 一 >2) Car®)tob (= 1,2,.,n) (6. 2. 3) 
Qi j=1, jt Qs 
也 就 是 
CeHD 人 _- (k) 1 
Xl 让 az 4Q13T3 “Ql,n1lTnl Ue Tb 
1 
p11) 1 Ck 人 
2 ”一 一 (一 0 对 aw = dn) 十 二 
人 (6. 2. 4) 
yl 1 
Xr 一 二 (一 aa 人 一 Ce 多 一 as 和 一 … 一 Co 已) 十 二 bo 
ym 


观察 式 (6. 2. 4) 可 知 ,我 们 可 将 矩阵 4 分 裂 (matrix splitting) 为 
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A=D—L—U (6. 2. 5) 
其 中 ， 
0 0 ai an 
zi 性 0 
D=—diaglananoman); —L=| ,—U = 
: a 
Qn *% ann1 0 0 
这 样 , 式 (6. 2. 4) 就 可 写成 如 下 的 和 矩阵 形式 : 
xD 一 DCU 二 DO 十 DTD (k=0,1,2,.) (6. 2. 6) 
又 由 式 (6. 2. 5) 可 知 L 十 U 二 D 一 A, 因此 式 (6. 2. 6) 变形 为 
xD 一 (一 DA) zw 十 DO (k=0,1,2,.) (6. 2.7) 
比照 式 (1.4.1) 可 知 , 在 Jacobi 迭代 中 ,其 迭代 矩阵 为 了 = 二 I 一 D "A, 另外 了 一 
Di'b. 


观察 式 (6. 2. 4) 可 知 , 在 第 一 个 方程 中 ,一 旦 算出 值 xf*+?，, 显然 ,马上 可 替换 掉 后 续 
方程 中 的 xz» ,以 保证 后 续 方 程 中 执行 每 次 计算 时 使 用 的 都 是 最 新 的 “信息 ”, 而 且 还 可 
能 会 加 快 收敛 速度 ,这 从 直观 上 很 容易 理解 ;类 似 地 ,一 旦 算出 xz&*?, 马上 可 替换 掉 后 续 


方程 中 的 x 的 ，……… ,这 种 迭代 过 程 就 是 Gauss-Seidel 迭代 .此 时 式 (6. 2. 3) 变 成 了 
由 De a 
Ui j= Qij= 计 1 Qa 
(6. 2. 8) 
也 就 是 
二 一 1 aa — gr CO— 0 i 一 az) 十 工 和 
Ull Cl1 
WB = ad -an iT — Amr ) 二 十 太 
4 了 C6; 2..9) 
zDD Ce 过 Me A — Qa 2 一 Ca TD a = 一) Es 
Cm G22 


同时 , 式 (6. 2. 6) 变 成 了 了 x? 了 = 二 DiLx* ?二 DiUx* 十 Db, 注意 到 (I 一 D1L)7 
二 (D 一 L) 了 D, 故 可 得 Gauss-Seidel 迭代 法 的 迭代 格式 为 


x 一 (DL Ux®+(D— Lb (k=0,1,2,..) (6. 2. 10) 


显然 ,在 Gauss-Seidel 迭代 中 ,其 迭代 和 矩阵 为 Bs = (D 一 L)7U, 另外 了 == 
(D—L)7b. 
对 方程 组 (6. 2. 1), 取 初 始 值 为 x = (0,0,0)T, 分 别 采用 上 述 两 种 方法 ,其 迭代 过 
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程 如 表 6 - 1 所 示 . 显然 ,两 种 方法 都 是 收敛 的 ,而 且 经 过 7 次 迭代 ,Jacobi 迭代 法 算出 的 
x% 与 精确 解 x” 的 误差 上 |x” 一 xz。 就 已 低 于 10”, 而 Gauss-Seidel 迭代 法 达到 这 个 目 
标 则 只 用 了 4 次 迭代 . 


表 6-1 Jacobi 和 迭代 法 与 Gauss-Seidel 迭代 法 的 迭代 过 程 比较 


Lyx* —x® ls 


全 仿 法 的 大 
(1..25;1. 1875,0, 9531)7 0. 25 


| x* —x® jls 


J 法 的 x 
上. 2551, 5;1. 257 | VQ.5 


(0. 875,0. 875,0. 875)T | 0. 125 (0. 9531,1. 0234,0. 9941)T 0. 0469 


3 |(1.0313,1.0625,1.0313)™ (0. 9941,1. 0029,0. 9993)T 0. 0059 


(0. 9993 ,1. 0004,0. 9999)T 二 0™ 
= 


4 |(0.9844,0.9844,0.9844)T 


5 |(1.0039,1.0078,1.0039)T 


6 |(0. 9980,0. 9980,0. 9980)T 


(1. 0005 ,1. 0010,1. 0005)7 


如 前 所 述 , 直观 上 我 们 觉得 Gauss-Seidel 迭代 应 该 优 于 Jacobi 迭代 ,直觉 作为 合 情 
推理 的 主要 成 分 很 值得 培养 ,但 千 万 别 忘 了 直觉 有 时 会 欺骗 我 们 . 例如 用 和 迭代 法 求解 下 
面 的 线性 方程 组 : 


1 2 =—21|x 1 
1] 1 1 ||zx|= |1 (6. 2. 11) 
2 2 1 J\x 1 


仍 取 初 始 值 为 x'” = (0,0,0)T, 使 用 3 次 Jacobi 迭代 ,就 得 到 精确 解 x* 二 (一 3,3,1)7， 
但 Gauss-Seidel 迭代 却 是 发 散 的 . 当然 ,我 们 不 会 “悲伤 ”和 ”心急 "镇 静 ” 之 后 我 们 就 会 
发 现 线索 :使 用 最 新 信息 肯定 没 错 ,既然 现在 有 些 问题 , 那 新 旧 信 息 拱 配 一 下 又 如 何 , 这 
就 是 说 ,能 否 设 计 一 种 带 参 数 的 迭代 格式 ,通过 参数 的 调节 ,改善 乃至 加 快 迭 代 的 收敛 速 
度 ? 具体 到 上 面 的 问题 ,在 已 求 出 x% 的 基础 之 上 ,仍然 利用 Gauss-Seidel 迭代 求 出 
x“ ,然后 能 否 再 利用 旧 的 x* 与 新 的 x*“ 的 线性 组 合 ,得 到 更 好 的 近似 解 ? 这 种 思想 
就 是 SOR(successive over relaxation method) 和 迭代 ,也 称 超 松 弛 和 迭代 ,这 里 “松弛 ”的 意思 
可 理解 成 在 参数 的 选择 上 ,我 们 具有 较 大 的 灵活 性 . 

按 上 述 分 析 ,SOR 迭代 的 迭代 过 程 如 下 : 

第 一 步 ,用 Gauss-Seidel 迭代 求 出 辅助 值 XX 了? = 二 (Xf? ,XD ,… ,MD )T, 其 中 


i = a 520) + 2 aszp) + G=1,2,, 《6.2.12) 
=] 五 了 一 寺 ] n 


第 二 步 ,选取 松弛 因子 w, 将 xm 与 ze 组 合成 待 求 的 x*t? 二 (xD ,zDD ,ztHD )T， 即 
a = To = ln) 


也 就 是 
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1 7 
zp = oD Cae) + Dy arp) tb | 0—wa C= 1,2,.",n) 


Ui j=1 i ;= 守 


(6. 2. 13) 
写成 矩阵 形式 ,就 是 
xm = (Do (oUt Dx 十 o(D 一 呀 ) bb (k=0,1,2,.") 

(6. 2. 14) 


其 迭代 和 矩阵 为 B, = 二 (D 一 woL)7TCwoU 十 (1 一 w)D), 另外 f= 二 w(D 一 wL) 1b. 显然 w 王 1 
时 SOR 迭代 法 就 退化 为 Gauss-Seidel 迭代 法 . 

选取 不 同 的 松弛 因子 ,显然 收敛 的 快慢 会 有 差别 ,这 就 引出 了 最 优 松弛 因子 的 想法 . 
遗憾 的 是 ,对 一 般 和 矩阵 ,目前 尚 无 法 确定 最 优 松 弛 因子 . 当然 ,对 某 些 特 殊 和 矩阵 ,存在 相关 
的 理论 结果 . 感 兴趣 的 读者 请 查阅 有 关 文 献 . 

上 述 三 种 古典 迭代 法 非常 容易 编程 实现 ,因此 Matlab 中 没有 提供 相关 的 内 置 函数 . 
我 们 自己 的 编程 实现 请 参考 本 书 配 套 程序 . 


6.2.2 剑 散 性 分 析 


下 面 我 们 分 析 古 典 迭 代 法 的 敛 散 性 . 事实 上 ,它们 都 满足 式 (1.4.1). 首先 , 由 式 

(1.4.1) 可 知 
x 一 X* 一 及 (xD 一 X* ) 一 B(x —xX*) 一 。… 一 Br (xo — x*) 

着 lim x 二 x", 则 上 式 两 边 取 极 限 , 即 得 (lim 及 )(Cx 一 x*) 一 0. 由 于 x 是 任 
意 给 定 的 , 故 系数 矩阵 lim B* 必 为 零 矩 阵 , 即 lim B* 一 O, 从 而 由 定理 6. 1. 5 可 知 氨 代 和 矩 
阵 的 谱 半径 p(B) 一 1. 

定理 6.2.1 对 于 任意 的 GE R” 和 x"”E€ RR", 迭代 格式 (1.4.1) 收敛 的 充 要 条 件 
是 p(B) 二 1. 

证 明 : 必 要 性 已 证 ,下 证 充分 性 . 

显然 , 当 p(B) 二 1 时 I 一 B 的 特征 值 X+ € (0,2), 因此 了 I 一 B 是 可 道 和 矩阵 , 故 迭 代 方 程 
x 二 Bx 十 f 有 了 唯一 解 , 记 为 x*". 注意 到 此 时 仍然 有 x 一 x* 二 B(x 一 x*), 且 当 p(B) 
三 1 时 ,由 定理 6.1.5 知 limB" 一 O 仍 然 成 立 . 因此 lim(x% 一 x*) 二 (limB*)(x® 一 x*) 
二 0, 即 lim x 二 x*. 证 毕 . 

上 述 判别 法 中 的 谱 半 径 不 易 计 算 ,我 们 同样 可 替换 为 更 易 计 算 的 矩阵 范 数 . 

定理 6.2.2 ”对 于 任意 的 JE R" 和 xm ER", 若 18 一 1, 则 迭代 格式 (1.4.1) 收 

进一步 地 ,与 以 前 的 手法 类 似 ,我 们 还 可 以 用 范 数 给 出 迭代 格式 (1.4. 1) 的 误差 佑 
计 式 . 当然 条 件 也 必须 由 p(B) 二 1 加 强 为 | 如 | 一 1. 

定理 6.2.3 若 和 迭代 格式 (1. 4. 1) 中 的 迭代 和 矩阵 B 满足 1B| 二 1, 则 成 立 如 下 误差 
估计 式 : 


lx® —x" |< Bl lx 一 | (6. 2. 15) 
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1 一 六 lxe 一 ze (6. 2. 16) 


B 


于 1zx2 —z®™| (6.. 2 17) 


| 二 2” | 县 
其 中 , x” 是 迭代 方程 x 二 Bx 十 了 的 精确 解 . 
证 明 : 由 于 x%“? 一 x” 二 B(x 一 x*), 两 边 取 范 数 可 得 
lx*? oe—x*|l<IlBl:. lx® —x’*| (6. 2. 18) 


递 推 可 知 , |x® 一 x* |< |Bl* .|x® 一 x*] 
同样 地 ,对 xe 一 x = B(x 一 xD ) 两 边 取 范 数 ,可 得 


x —x® le [Bl lx — wl (6. 2. 19) 
这 样 ,结合 范 数 的 性 质 和 式 (6. 2. 18), 可 知 
| xb ox®|= |(x® ox) (x 一 xs 
三 Ix® ex |—|x* ?xl 1BDIx®—z:l 


注意 到 1B| 二 1, 并 结合 式 (6. 2. 19) 即 得 


|x® 一 x* | 二 |xzerb — x® | 让 |x® 一 xp | 


站 
1 一 |B| 
由 于 对 任意 正 整数 户 , 都 有 Tx* 一 x 之 1B1: 1x22 一 xD , 因此 反复 递 推 上 


式 可 知 
CR ___ IB| (到 __ hl1) 和 | 再 外 KE dy 
| >x 元 | 入 iT 1x 弟 4 业 | 委 < 下 呈 lz | 


由 式 (6. 2. 15) 可 知 , 范 数 ‖B| 越 接近 零 , 则 迭代 格式 (1. 4. 1) 收敛 的 速度 越 快 . 式 
(6. 2. 16) 则 指出 了 相 邻 解 之 差 的 某 个 倍数 就 是 迭代 解 误差 的 上 限 ,这 样 , 当 相 邻 两 次 迭 
代 的 误差 足够 小 时 , x”% 与 精确 解 x* 也 会 足够 靠近 ,因此 式 (6. 2. 16) 可 作为 判断 计算 是 


否 该 终止 的 判 停 准则 . 但 当 | B| =: 1 时 ,倍数 了 | 轨 晤 | > 1, 这 个 准则 变 得 不 可 靠 


按 最 佳 逼 近 原 理 , 在 求解 线性 方程 组 hx 一 尺 时 ,还 可 以 考虑 使 用 残 差 (residual) 
r 二 bb 一 Ax. 一 般 应 使 用 相对 残 差 (relative residual) 准则 , 即 上 请 守 委 sy 这 里 


s 为 相对 残 差 上 限 . 

对 于 线性 方程 组 (6. 2. 1), 计算 可 知 | 3 = 1B1| ,= 0.5 二 1, 根据 定理 6. 2. 2, 使 用 
Jacobi 返 代 法 求解 线性 方程 组 (6.2.1), 结果 是 收敛 的 . 同样 ,由 于 |Bcs|, = 二 0.5， 
故 用 Gauss-Seidel 迭代 法 求解 线性 方程 组 (6.2.1), 结果 也 是 收敛 的 ,对 线性 方程 组 
(6. 2.11), Bj 的 几 个 常用 范 数 值 都 大 于 1, 进 一 步 计 算 可 知 Bj 的 特征 值 全 为 零 ,因此 p(B)) 
二 0 过 1, 由 定理 6.2.1 可 知 Jacobi 迭代 是 收敛 的 .但 Bos 的 特征 值 为 0,2 土 2Y3, 即 p(Bes) 
二 2(1 十 V2) 之 1, 故 Gauss-Seidel 迭代 是 发 散 的 . 

用 定理 6. 2. 1 来 判断 迭代 法 的 敛 散 性 , 谱 半 径 的 计算 显然 是 个 瓶颈 ,而 定理 6. 2. 2 
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仅仅 是 充分 判别 法 . 对 Jacobi 迭代 而 言 , 这 两 个 判别 法 基本 上 够 用 了 ,因为 Bj 的 计算 比 
较 容易 . 但 对 Gauss-Seidel 迭代 来 说 , Bas = (D 一 L) DU 的 计算 涉及 较 复 杂 的 求 逆 运 算 ， 
显然 不 是 很 方便 . 

回 看 线性 方程 组 (6. 2. 1) 的 系数 矩阵 4, 易 知 4 是 三 对 角 和 矩阵 ,这 提醒 我 们 如 果 能 
直接 根据 系数 矩阵 是 否 为 某 种 特 型 或 特性 矩阵 来 判断 敛 散 性 ,显然 更 加 方便 . 另外 ,使 用 
矩阵 范 数 尤 其 是 仅仅 对 矩阵 元 素 进行 简单 加 工 的 1 范 数 或 wm 范 数 ,显然 也 可 绕 开 谱 半径 
这 个 瓶颈 . 基于 这 两 点 ,我 们 来 考虑 Jacobi 迭代 矩阵 及 = 二 I 一 DA 一 DTT(D 一 A) 的 oo 范 
数 |B)|. 定理 6. 2. 2 要 求 Bj 二 1, 也 就 是 


i | 十 | aa | 十 | a | 十 | a | 十 … 十 | oa | )=<1 (i=1,2,.,n) 


| as | 


此 即 


lail> 2) las| Gi= 1,2,%,n) (6. 2. 20) 
j=1,jzi 
定义 6.2.1 如 果实 方 阵 4 满足 式 (6. 2. 20), 则 称 4 为 严格 对 角 占 优 矩 阵 (strictly 
diagonally dominant matrix) ;如 果实 方 阵 4 满足 


lals 2 lays| 全 一 12， 7 (6. 2. 21) 


且 其 中 至 少 有 一 个 严格 不 等 式 成 立 , 则 称 4 为 弱 对 角 占 优 矩 阵 (weakly diagonally domi- 
nant matrix). 

定理 6.2.4 如 果实 方 阵 4 严格 对 角 占 优 , 则 Jacobi 迭代 和 Gauss-Seidel 迭代 都 
收敛 . 

证 明 : 若 4 严格 对 角 占 优 , 则 必 有 | az | 二 0, 因此 了 DD 是 可 首 和 矩阵 . 设 Jacobi 迭代 矩阵 
Bj 的 某 个 特征 值 14 三 1, 则 和 矩阵 妇 一 L 一 U 也 严格 对 角 占 优 的 ,因而 也 是 可 逆 的 . 这 是 
因为 任何 严格 对 角 占 优 矩 阵 $ 肯定 是 可 疼 的 ,否则 齐 次 线性 方程 组 Sx = 0 必 有 非 零 解 . 
若 令 |zi| 二 上 |x|,== 1, 则 有 


n nn n 
[sl= |sz =|— DB sw BD lalsl< .sl 
1 了 =157A j=1,Jj¥i 


这 显然 与 $ 是 严格 对 角 占 优 和 矩阵 相 了 矛盾. 

注意 到 一 Bj 二 一 D7(L+0) = 二 DTGQD 一 L 一 U0), 因此 烧 一 Bj 也 是 可 道 的 ， 
即 其 行列 式 | 一 Bj | 关 0, 这 显然 与 4 是 Bj 的 特征 值 相 矛盾 . 因此 也 的 任意 特征 值 的 
模 均 小 于 1, 故 Bj 的 谱 半 径 p(Bj) 二 1, 即 Jacobi 迭代 收敛 . 

类 似 地 , 当 4 严格 对 角 占 优 时 ,下 三 角 矩 阵 也 一 克也 是 可 逆 的 . 设 Gauss-Seidel 迭代 
和 矩阵 Bos 的 某 个 特征 值 |4| 宇 1, 则 和 矩阵 功 一 入 一 U 也 是 严格 对 角 占 优 的 . 这 是 因为 由 式 
(6. 2. 20) 可 知 


| 


n n 站 3 n 
Iaai | 涯 D>, [aas|= 2 Nasl|+ 2) Naas | > Naas|+ Bla, | 
; jo j= 计 1 j=1 j= 


J=1,JAi j=1 
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前 面 已 证 任何 严格 对 角 占 优 矩 阵 $ 肯定 是 可 首 的 ,这 样 六 一 窟 一 U 也 是 可 道 的 ,因此 由 
iT 一 Be 王 (D 一 DOD 一 江 一 D) 

可 知 | 媒 一 Bos | 关 0, 这 也 与 和 是 Bos 的 特征 值 相 矛盾 . 这 就 是 说 必 有 p(Bos) 二 1,， 即 
Gauss-Seidel 迭代 也 是 收敛 的 . 证 毕 . 

最 后 ,我们 给 出 SOR 迭代 的 必要 和 充分 条 件 . 

考虑 B, = 二 (D 一 aL) ii[wU 十 (1 一 w)D]. 由 于 D 一 已 是 下 三 角 和 矩 阵 , 其 道 
(D 一 wL) 自然 也 是 下 三 角 和 矩阵 , 且 | (D 一 wL) | 二 anl a …aa = 二 1D|7, 而 wU 十 
(1 一 wD 是 上 三 角 和 矩阵 , 其 行列 式 为 |aU 十 (1 一 wD| = (一 w)"anaz*…as 一 
(1 一 w)*|D|, 因此 


[|B,|= |1(D—woL) | |oU 十 (1 一 o)D| 王 (1 一 o)". 
设 B, 的 特征 值 为 hl，…， 则 | 吾 | 王 和 一 (1 一 o"， 从 而 
1 一 ol 三 | 一 |。 | la 委 (CoGB 7 
此 即 11 一 w| 志 p(B,). 故 当 SOR 迭代 收敛 , 即 当 6 有 及) 二 1 时 ,可 知 |1 一 w| 二 1, 即 w€ (0,2) 


定理 6. 2.5 对 对 角 元 都 非 零 的 实 方 阵 4, 若 求解 4x ==b 的 SOR 迭代 是 收敛 的 , 则 
0 过 下 过 2 C6. 2. 22) 


定理 6. 2. 5 说 明 收 敛 因子 w 只 能 在 (0,2) 内 取 值 ;那么 反 过 来 ,对 什么 样 的 系数 矩阵 
4, SOR 迭代 是 收敛 的 呢 ? 

定理 6.2.6 若 实 和 矩阵 4 二 0, 上 且 wE (0,2), 则 求解 4x ==b 的 SOR 迭代 是 收敛 的 . 

证 明 : 参 见 文献 [74]. 

进一步 地 ,也 可 以 考虑 对 角 占 优 的 情形 . 

定理 6.2.7 如 果实 方 阵 4 严 格 对 角 占 优 , 且 wE (0,1), 则 求解 Ax = 二 6b 的 SOR 适 
代 是 收敛 的 . 

证 明 :与 定理 6. 2. 4 类似 , 略 去 . 


6.3 ” 解 线性 方程 组 的 现代 迭代 法 


6.3.1 共 斩 梯 度 法 


首先 我 们 给 出 求解 线性 方程 组 的 变 分 原理 或 Ritz 原理 . 
定理 6.3.1 如 果 宛 阶 实 方 阵 4 之 0 且 E R”, 则 


Axr’ = bp(x’ ) = ming(x) (6. .1) 
xzER” 
其 中 , p(x) 称 为 二 次 泛 函 ,其 表达 式 为 
px) = x Ax—2b'x= (x,Ax)—2(x,b) (6., 3 2) 
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证 明 :直接 计算 可 知 一 2(aazl 十 azzz 十 十 aazo) 一 20, i 二 1,2,…,n, 即 


Vp(x) = 2(Ax — 1b) 
若 有 x* 使 得 pCx* ) = ming(x)，, 则 由 多 元 函数 的 极 值 理 论 可 知 VpCx* ) = 0, 此 即 
xER” 
Ax" =b. 
反之 ,车 有 Ax” = 二 b, 注意 到 4 二 0 及 7 一 三 7， 则 对 任意 y € R", 有 
px 十 y) 二 (x* 十 y)TACx* 十 y) 一 2 bT(x* 十 y) 
~ x)TAx* Ty Ax Ty Ax yAy—2bix" —2b'y 
= (x )TAx’ +y biybiy Ay—2b x 一 207? 
= p(x’ )++y'Ay > p(x’) 


即 x* 使 得 g(x) 达到 极 小 点 . 证 毕 . 

变 分 原理 指出 求 二 次 泛 函 p(x) 的 极 值 可 转化 为 求解 线性 方程 组 Ax 二 b, 但 就 求解 
线性 方程 组 而 言 ,这 里 则 强调 其 反方 向 的 处 理 , 即 求解 Ax 二 b 的 问题 转化 为 求 二 次 泛 函 
g(x) 的 极 值 . 

对 于 求 二 次 泛 函 p(x) 的 极 值 ,一 般 先 任意 给 定 初始 向 量 x”, 并 确定 一 个 使 得 p(x) 
的 值 变 小 即 “ 下 山 ” 的 方向 pW ,从 而 可 在 过 点 x” 的 直线 x 二 x 十 ap” 上 找 一 点 x 一 
x 十 aop”， 即 确定 步 长 wo, 使 得 对 任意 实数 a, 都 有 g(x) 三 g(x"), 也 就 是 确定 了 该 
直线 上 的 极 小 值 点 x 7” . 接 下 来 ,从 x” 出 发 , 按 下 山 方向 p”, 在 直线 x 二 x 二 ap 上 
确定 x”，, 使 得 g(x) PC ),…. 一 般 地 ,从 x% 出 发 , 按 下 山 方向 p”，, 在 直线 x 一 
x” 十 ap” 上 搜索 到 一 点 x“ , 即 确定 步 长 mi, 使 得 g(x”) 宇 q(x“ ), 这 里 & 王 0,1， 
2,…. 显然 不 同 的 步 长 和 下 山 方向 可 得 到 不 同 的 算法 . 

思考 :为 什么 是 下山? 而 不 是 ”上山 2”” 

如 何 确定 w 呢 ? 假定 此 时 已 知 下 山 方向 p”, 则 问题 就 是 在 直线 x 二 x 十 ap% 上 
求 PCz) 的 极 小 值 点 Y ”二 x 十 gaap”. 设 


ja) 一 PC 十 op 外) 一 CO tap®) AY 十 op 多 ) 一 207Cx +ap® ) 
px™® 和 十 站 Cp )TAp® ee 2a (r'® bE 


其 中 ， rr 六 一 4AxG 由 极 值 理论 ， a 满足 方程 f(a) 一 2x (DO ) 工 AD -= 二 和 田 CET 
= 0， 即 


(k) NT) (k) (k) 
呈 本 = 2 (6. 3. 3) 
p™*)Ap (p® ,Ap'*) 
接 下 来 考虑 如 何 确定 下 山 方 向 p. 给 定 初始 向 量 x 后 ,显然 易 知 残 差 ro = 二 bb 一 
Ax". 根据 Gram-Schmidt 正 交 化 的 经 验 , 我 们 令 p'” = ro ,于 是 有 


OO) 


Cr yy (r™,p. 


二 Cp )TAp'™” (p™® ,AP CO 9 


后 面 的 各 步 , 如 果 仍 选 p* = r% = 二 b 一 Ax” ,上 一 1,2,…, 此 时 的 算法 就 是 最 速 下 
降 法 (steepest descent method). 但 这 种 算法 是 一 种 不 稳定 的 算法 ,因为 当 r* 较 小 时 ,由 


Qk 


XGOD = x Fap®, r 一 万 一 4AxG) 


Qo 
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于 舍 人 误差 的 影响 ,会 偏离 最 速 下 降 方 向 . 

从 迭代 角度 看 ,自然 要 用 已 算出 的 p“? 来 计算 p”. 由 于 我 们 希望 p” 比 r* 更 好 ， 
同时 希望 运算 量 不 大 ,因此 自然 想到 在 过 点 x” 且 由 p* ”和 xr” 所 张 成 的 二 维 平面 x2 
内 选取 p”，, 即 

ns 一 {x | X 一 x 二 Er® 十 7P ,én €E R} 

观察 图 6--1 可 知 ,图 中 r* | p“”. 这 是 因为 ， 
当 r% 关 0 时 (车 r% = 二 0, 则 x* = 二 x 即 为 所 求 )， 
注意 到 x = x ap* ， rl 一 厂 一 4 
以 及 式 (6. 3. 3), 则 


图 6-1 如 何 选取 下 山 方向 


《而 多 到 ,re J} = (pe ,b— Ax'*) es (p*™ ,bb— Ax —aAp'"") 
= (pH ,rED)— oi (pH ,ADpwD) 一 0 
同样 地 ,我 们 考虑 g(x) 在 平面 六 内 的 极 小 值 . 令 
SC 人 力 一 p(x) = p(x® 十 Er 和 np ) 
SE (x 二 Er® 十 7P TD) AGO 十 Er 虽 十 让 一 区 bx® 二 Er 二 7 
分 别 对 &,w 求 偏 导数 ,并 注意 到 rr | p 和 > ,可 得 


og = (k) NT (k) (k) NT Ch (kNT jk) 
3 2L8 (ro ) Ar® 十 7 Cr )T4P | 


og _ (TAO CD JT Ap (hl) 
By 2[¢ Cr ) Ap* i +n pp TAp®] 


因此 , glx) 在 平面 x 内 的 唯一 极 小 值 为 x 二 x 中 十 jr 中 十 np 了 ,其 中 与 ,加 满足 
方程 组 


& (7 ) 工 Ar) 十 办 人) > re)T re 
(6. 3. 4) 


名 CO YTADET 十 (pe VITApED 一 0 
显然 ,当天 关 0 时, 必 有 与 关 0, 否则 由 式 (6.3.4) 中 第 二 个 方程 可 知 


mw (p” ")'Ap“ 一 0, 再 由 4 二 0 即 得 六 一 0( 和 否则 p4 72 一 0 与 已 知 矛盾 ). 因此 可 取 
下 山 方 向 为 


p® 一 Ey 一 六 0 人 pe (Rl, 
0 0 


. (Rk) NT (&—1) 
车 记 B 一 至, 则 由 式 (6. 3. 4) 中 第 二 个 方程 可 知 8B. 和 , 因此 


人 了 (rt) ,AP ) 
Be (p® )T4P 下 (p® ,Ap™) 


(k= 0,1,2,.%) (6 3. 57 


又 因为 x se 大 十 ap ， De = rt 二 Bp 因此 


第 6 章 ”矩阵 分 析 及 其 应 用 。253 。 


rt =b—Art 一 请 一 站 CO 十 atp) 一 rr 一 apP (k= 0,1,2,) 
(6. 3. 6) 


其 中 , Ap“ 已 在 计算 w 的 式 (6. 3. 3) 中 求 出 ,所 以 我 们 可 以 利用 递 推 式 (6. 3. 6) 来 计算 x?. 
可 以 证 明 , 上 述 分 析 中 得 到 的 向 量 组 {r*} 和 {p2 }) 具有 如 下 性 质 : 
(1) 对 任意 0 过 i 二 jj 二 ,都 有 pr?; 
(2) 对 任意 0 志 i,j 志 &, 当 i 关 jj 时 ,都 有 rr | ro 
(3) 对 任意 0 过 i,;j 三, 当 i 关 j 时 ,都 有 (p",Ap”) 一 0; 
(4) span(r'® ,7-0) ye) 2 span( 有 (0) ,有 GD DC ) a span(r'™ ,Ar'®" ,2 AL ro 》 


证 明 : 使 用 归纳 法 . 当 & = 1 时 ,注意 到 


Po 一 ro ,pV =r 十 记 p@ ， rmD 一 ro 一 ao4pC 
直接 验算 可 知 


(po roD) 一 (poyro) 一 oo(po ,4pw) 一 (poro) 一 (roO,po) 一 0 
(reo ,1 ) i (p™ sr ) = 0 
(有 0) ,4P 0 ) 一 (p"®™ , Ar 二 BAp"™) Be Ca ,Ar'”) +Blp®™ ,Ap'™) 
£3 CEB ,Ar'”) a Cr ,Ap'”) i (Ap'” ,1 ) ee (ro ,Ap'”) py 0 
span(P ,p")= span(p™ ,rTPp™) = span(r® ro 十 Br ) 
(0) 


ea span(r ry) st span(r'™ sr —aoAp'”) 


二 二 span(r'™” ,ao4r'0 ) Span(r'0) ,Ar'™”) 
假设 上 述 性 质 对 成 立 ,下 面 证 明 它们 对 十 1 也 成 立 . 
(1) 利 用 式 (6. 3. 6) 及 归纳 假设 ,可 知 对 任意 0 二 i 过 一 1, 有 
(p™ st ) = (p® 7 ) 一 ak (DO ,Ap'®) Pe 0—a0 一 0 
又 由 式 (6. 3. 6) 和 式 (6. 3. 3) 可 知 
(p®™ 7 到 二 (有 ,7 ) —a(p™ "AD ) = (PC 各) i (p™ 7 ) 一 0 


因此 对 & 十 1, 性 质 (1) 也 成 立 . 

(2) 由 (1) 的 证 明 可 知 r*? | po ,0<i<k, 即 4% | span(po ,po ,pw) ,由 
归纳 假设 ,此 即 r**? | span(ro ,ro ro )， 从 而 rt | rD ,0 去; 去 人， 结合 归纳 假 
设 可 知 对 & 十 1, 性 质 (2) 也 成 立 . 


(3) 由 归纳 假设 , pP ”二 +r 十 Bp 和 式 (6.3.6) 以 及 性 质 (2) 可 知 ,对 0 过 i 过 
k 一 1,， 有 


(p? i = (Cp ,reH)) +B(p® ,Ap'™) 


es (AP Jr) 十 0 a 工 (ro — pl) Pet ) 一 0 


i 


而 由 式 pe 一 rt 十 Bp% 及 式 (6. 3. 6) 可 知 


(有 sp et = (AD i ) 一 (Ap® FeHD) ) 十 BB (Ap® ,DO ) 
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让 (Ap®™ rr) ss ret) ,Ap®™) 一 0 
故 由 归纳 假设 可 知 对 十 1, 性 质 (3) 也 成 立 . 
(4) 由 归纳 假设 可 知 re ,Dp 既 span(r'0) ,Ar®™ ey > 因此 
rtD) 一 ph —aAp®™ 惰 span(r'0) 了 ye , Akr‘®) ,At Fr0 ) 
petD = yD) +Bp®™ 于 span(r‘® Ar ye ,好 (0) ,AtIro ) 
由 于 性 质 (2) 说 明 向 量 组 ro ,ro ee kt) 和 向 量 组 p'® ,有 GD CD) 都 是 线性 无 


关 的 ,因此 可 知 对 & 十 1, 性 质 (4) 也 成 立 . 
由 归纳 法 原理 可 知 , 上 述 性 质 都 成 立 . 证 毕 . 


利用 上 述 性 质 , 可 知 
(rtD ,Ap®™ ) 一 1 (rer Fe i retD) 一 0 一 1 (jry stl)) 
Qk Qk 
= lp ,pt ) (6. 3 7 
Qk 
(p'® ,Ap*)= tp (人 rt ) -a RD ,Tr ) 一 人 0 
k k 
= 1 (pw iD 7) = 1 (rw sr ) 间 阁 se 1 yw ,Fr ) 
Qk Qk Qk 
因此 
= (7 0 ) a (7 ) Tr® 
Qk (pw ,Ap™) (p® )T4p (6. 3. 8) 
再 结合 式 (6. 3. 5)、 式 (6. 3.7) 和 式 (6. 3. 8), 可 知 
(rtl) spt ) (rl) ) Tr 
放 一 Cr OT 人 


这 样 我 们 就 得 到 了 ww 和 Bi 的 简化 计算 公式 . 
由 上 所 述 , 即 得 求解 对 称 正 定 线性 方程 组 的 共 斩 梯 度 法 ( Conjugate Gradient) BN] CG 
法 . 我 们 给 出 其 Matlab 代码 实现 如 下 : 


function [x,iter]= conjgrad (A,b,x0,nmax,tol) 
iter= 0;r= b- A* x0;err= norm(r)^2;x= x0; 
while err> tol & iter< nmax 

iter= iter+ 1 

if( iter= = 1) P= r; 

else 

beta= err/errold; p= r+ beta* p; 

end 

v= A* p;% 工 作 变量 

alpha= err/(p'* v); x= x+ alpha* p; r= r- alpha* v; 

errold= err; err= norm(r)^2; 


end 
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显然 , 共 思 e 梯 度 法 中 每 迭代 一 次 ,只 涉及 一 次 BLAS2 级 的 运算 . 测试 表明 ,对 方程 组 
(6. 2. 1), 同样 取 x = (0,0,0)T, 使 用 上 面 的 共 恩 梯度 法 ,2 次 授 代 就 得 到 了 精确 解 . 
Matlab 中 也 提供 了 内 置 函 数 cgs, 其 语法 为 


X= Cgs (A,b,tol,maxit) 


其 中 ,tol 用 于 指定 计算 精度 , 缺 省 值 是 10“, maxit 用 于 指定 最 大 迭代 次 数 , 缺 省 值 是 
min(n,20). 

定义 6. 3. 1 对 任意 两 向 量 p,q € R", 阁 它们 的 A 内 积 为 零 , 即 (p,q)4 一 (p,Ag) = 
PP Aq 一 0, 则 称 p,q 互相 A 正 交 或 互相 共 斩 Cmutually conjugate). 

定义 6.3.2 对 任意 A E R” 和 向 量 r € R"”, 记 


K(A,r,k) = span{r,Ar,:…,A!r) (6. 3. 10) 


并 称 之 为 Krylov 子 空间 . 

显然 ,上 述 几 条 性 质 也 说 明 , 共 斩 梯 度 法 迭代 产生 的 剩余 向 量 组 ro ,rn?,…,r% 是 
Krylov 子 空间 K (4,r ,kk 十 1) 的 一 组 正 交 基 , 而 下 山 方向 组 po2 , pp 则 是 
K(C4,r ,k 十 1) 的 一 组 共 斩 正 交 基 ,这 也 给 出 了 上 述 算 法 被 命名 的 缘由 . 

关于 共 力 梯度 法 的 敛 散 性 ,可 以 证 明 如 下 的 误差 估计 式 : 

定理 6. 3.2 用 共 斩 梯 度 法 求解 对 称 正 定 线性 方程 组 Ax 一 b, 得 到 的 (x% } 满足 


es 
Vrz 十 1 


|x® 一 过 去 2 | xc —x*|a 《6.2 11) 


其 中 , Ax* 二 b, ks = kz (A). 

证 明 : 请 参考 文献 [71]. 

定理 6. 3. 2 说 明 , 共 轿 梯 度 法 的 收敛 快慢 依赖 于 系数 矩阵 4 的 谱 分 布 情况 . 例如 当 
心 六 1 时 , 它 的 收敛 相当 慢 . 当然 ,当心 之 1 时 (比如 方程 组 (6. 2. 1) 的 系数 矩阵 ) , 共 斩 梯 
度 法 会 收敛 得 很 快 . 这 就 催生 了 一 大 类 预 处 理 技术 (precondition technique) ,希望 通过 适 
当选 择 矩 阵 M, 将 Ax 二 b 转变 成 良 态 的 A'y 二 b' ,其 中 M0,4’ = MTAM, y= 
M"'x, b' 一 MD 感 兴趣 的 读者 请 查阅 相关 文献 . 


6.3.2 子 空间 迭代 法 
前 面 的 共 轿 梯度 法 仅 适用 于 系数 矩阵 A 二 0 的 情形 ,而 在 许多 计算 问题 中 ,尽管 4 一 


般 是 稀 玻 矩阵 ,但 却 未 必 是 对 称 的 . 这 就 需要 寻找 新 的 算法 . 
考虑 大 型 稀 玻 线性 方程 组 
Arx=b 《6. 3. 12) 
其 中 , A € R” 是 可 道 矩 阵 , b € R" 也 是 已 知 的 向 量 . 
显然 方程 组 (6. 3. 12) 的 解 为 x 二 471b. 我 们 将 4- 展开 为 已 知 矩阵 4 的 多 项 式 ,以 
便 使 用 迄 代 法 . 联想 到 Cayley-Hamilton 定理 , 设 p(A) 一 妨 十 az 十 … 十 ai 十 ao 为 
4 的 特征 多 项 式 , 则 


PC4) 一 4 十 ol4 十 … 十 ca4 二 ao 一 O 
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两 边 乘 以 4 , 当 ao 天 0 时 (ao = 0 是 不 可 能 的 ,为 什么 ?), 有 
AT ah "二 "二 aD 


从 而 x 二 A i'b A" b+arA" bt tab), 这 说 明 x EK(A,b,n). 这 样 ,利用 


Krylov 子 空间 ,我 们 就 可 在 Kk(4,b,&k) 中 计算 出 x”，, 并 可 逐步 扩张 到 计算 x” € K(4， 
b,n). 理论 上 ,只 需要 nn 步 迭 代 , 就 可 得 到 x 一 工 一 4 720. 
pee 三 5 一 Ax"” 构造 出 了 KC(A,rW ,十 1). 类 似 地 ,对 
方程 组 (6. 3. 12) , 若 令 x 二 x” 十 z, 显然 方程 组 (6. 3. 12) 等 价 于 方程 组 


Az=r™ 《6. 3. 43» 


这 样 ,我 们 只 需 在 Krylov 子 空 间 XK (4,r' ,&) 中 计算 出 zx ,进而 可 利用 x 二 x 人 十 < 
来 确定 x*. 
令 K; 二 (A,rW ,k). 问题 是 如 何在 Kx 中 确定 z% 呢 ? 也 就 是 说 采用 什么 样 的 
原理 ,才能 够 在 子 空间 K 中 得 到 方程 组 (6. 3. 13) 的 最 佳 近似 解 xe 呢 ? 对 ,最 佳 逼 近 ! 
xz” 应 该 是 Kx 中 的 最 佳 和 逼近 . 也 就 是 说 , 残 差 r" 一 如 应 该 与 某 个 子 空间 Cx 正 交 . 
求解 线性 方程 组 (6. 3. 11) 的 Galerkin 原理 :在 KK 中 找 方程 组 (6. 3. 13) 的 近似 解 
xz” ,使 得 残 差 +r” 一 Az” 和 ZL 中 的 所 有 向 量 都 正 交 , 即 求 z* E Ki，, 使 得 


A | WS Vw EE By (6. 3. 14) 


这 里 ， R" 中 的 向 量 组 y ,yy ,… yw 和 wi ,ws，… ,wi 分 别 张 成 维 子 空间 Ks 和 C 
令 Vi 二 《my 一 (CH 由 于 zz ERK, 故 过 可 表示 为 


z0 一 ViyyO E 要 4 《6. 3 15) 
从 而 式 (6. 3. 14) 就 被 改写 为 WE(r% 一 AViy) = 0, 也 就 是 
WiAViy® = Wir® (6. 3. 16) 


这 就 是 Galerkin 原理 的 矩阵 形式 . 假设 WiAV' 可 闭 , 则 由 方程 (6. 3. 16) 可 求 出 ye , 进 
而 由 式 (6. 3. 15) 即 可 得 出 方程 组 (6. 3. 13) 的 近似 解 zx ， 

Galerkin 原理 告诉 我 们 , 子 空间 Ki 未 必 一 定 要 选择 K (4,r'o ,k). 这 样 就 留 下 了 巨 
大 的 空白 (当然 也 创造 了 巨大 的 想象 空间 ), 即 如 何 选取 右 子 空间 K; 和 左 子 空间 £4, 以 
及 如 何 选 择 它们 的 基底 即 向 量 组 ,yp… ,yw 和 wi ,ws，,… ,ws. 显然 不 同 的 选择 给 出 了 方 
程 组 (6. 3. 13) 基于 Galerkin 原理 的 不 同 算法 ,统称 为 求解 线性 方程 组 的 投影 类 算法 
(projection method) ,其 中 取 Ki 二 (A,r ,kk) 的 算法 统称 为 Krylov 子 空间 法 . 从 计算 
量 来 看 ,这 些 子 空间 的 规模 一 般 要 远 远 小 于 原来 的 矩阵 4 的 规模 ,因此 大 规模 问题 被 降 
维 为 中 规模 乃至 小 规模 问题 . 这 就 解释 了 何以 近 几 十 年 来 ,Krylov 子 空 间 法 事实 上 已 成 
为 破解 “ 维 数 灾难 ”的 “灵丹妙药 ”. 

共 斩 梯度 法 其 实 也 是 一 种 Krylov 子 空间 法 , 它 实际 上 就 是 在 K， = K (A,b,k) 中 选 

择 x% 来 极 小 化 (x 一 x* )TA(x 一 x"). 

在 Krylov 子 空间 法 中 ,就 C4 的 选取 而 言 ,考虑 到 计算 要 简单 ,经 常用 到 以 下 两 种 选 
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择 , 其 一 是 取 Ce 二 Ki, 这 就 是 下 面 要 讨论 的 Arnoldi 算法 ,其 中 构造 kx 的 正 交 基 vi， 
22 的 过 程 被 称 为 Arnoldi 过 程 (process), 正 交 基 ,ys ，…，, vi 被 称 为 Arnoldi 向 量 . 

由 于 张 成 Ki 的 六 ,4r ,…,A“'r"” 是 线性 无 关 的 ( 留 作 练习 ) ,因此 Arnoldi 过 程 
可 采用 Gram-Schmidt 正 交 化 过 程 , 即 


人 二 
Ven = 4 一 > Jay， ， Wn 一 一 负 ! C6. 38, 7 
i=1 


= 一 一 
| ee |， | | YAH | 2 


其 中 ， ha = (Avi svV:), 并 记 AH 一 | Vet |;. 写成 矩阵 形式 ,就 是 


Lvi 二 这 hi 十 hziv2 
Av, = hizbi 十 jzVa hav 


Av: = hpi huve hier.avel 


也 就 是 
4W = ViHi -wel = Vu (6. 3. 18) 
hi hiz oe hi 
hz hz es hax 有 目 
其 中 , H = .， s 是 上 Hessenberg 矩阵 ;， uw 二 hi vi ; ex 是 & 阶 单 


el hm 


ee H' 
位 矩阵 的 第 上 列 ; 下, 一 ， | 是 (& 十 1) Xk 阶 箱 阵 ,其 最 后 一 行 除 最 后 一 个 元 素 


AH Ck 
hen,s 外 全 是 零 元 素 . 式 (6. 3. 18) 也 被 称 为 矩阵 4 的 Hessenberg 分 解 ,其 效果 如 图 6-2 
所 示 . 注意 到 ViVi 二 I 及 Vivei 一 0, 用 V7 左 乘 式 (6. 3. 18) 两 边 , 即 得 


ViAV, = H; (6. 3 19) 


十 uel 


nxn 放大 nxk 大 X 大 


图 6-2 和 矩阵 A 的 Hessenberg 分 解 
取 W 二 Vi 并 令 p 一 |r 1, 则 方程 (6. 3. 16) 变 成 了 


ViAViy® = BoVivi (6. 3, 20) 
注意 到 v1 二 Viel, 这 里 el 是 阶 单位 和 矩阵 的 第 一 列 ,再 结合 式 《6. 3. 19), 可 知 
Hiy™ = pe (6. 3. 21» 


如 果 HH 可 逆 上 且 & 比较 小 , 则 可 以 用 直接 法 求解 方程 组 (6. 3. 21), 进而 求 得 原 方程 组 
(6. 3. 12) 的 近似 解 x*. 这 种 求解 方法 被 称 为 Arnoldi 完全 正 交 化 法 (Full Orthogona- 
lization Method) ,简称 FOM 法 . 显然 FOM 法 最 大 的 问题 是 HH 可 能 奇异 ,此 时 算法 会 出 
现 亚 性 中 断 . 
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关于 Arnoldi 算法 的 敛 散 性 ,可 以 证 明 如 下 的 误差 估计 式 : 
定理 6.3.3 用 FOM 法 得 到 的 近似 解 x” 的 残 差 的 大 小 为 


| 有 = hon.s | ekys| (6. 3. 22) 
证 明 :利用 人 = x 十 Z 、 式 (6. 3. 18) 及 式 (6, 3. .21)3 并 注意 到 犁 一 Vkel ， 可 知 
r= b Ax'® i b Alx'™” 二 Vey) ES ro — AViy: 


= Bn — VeHeye — uelye = Br — VaBoer — herievenl el ys 


=— hgriz (ey ) Vn 


由 于 | wa |， 一 1, 因此 |r® |， PH | efye |. 证 毕 . 
至 此 ,我 们 可 给 出 FOM 法 的 Matlab 代码 实现 如 下 : 
function [x,err]= fom(A,b,x0,k) 
r0= b- A* x0; beta= norm(r0); 
[V,H] = arnoldi (A,r0,k) $ 使 用 The Matrix Function Toolbox 中 的 程序 
I= eye(k); el= I(:;,1); y= H(1:k,l1:k)^(- 1)* (beta* el); 
X= x0+ V(:71:k)x y; 
err= H(k+ 1,k)* abs(y (k)); 


其 中 使 用 了 Nick Higham 开发 的 “The Matrix Function Toolbox”, 下 载 地 址 为 http:// 
www. ma. man. ac. uk/~higham/mftoolbox. 

在 Krylov 子 空间 法 中 ,选取 C 的 另 一 种 方式 就 是 取 Ce 一 AKi，, 这 就 得 到 了 更 有 用 
的 广义 极 小 残余 法 (Generalized Minimum RESidual method) ,简称 GMRES 法 ,其 好 处 
是 不 会 出 现 恶 性 中 断 , 即 式 (6. 3. 16) 中 的 矩阵 B == WLiAV 肯定 是 可 逆 的. 

事实 上 , 设 wi,w,…,wWi 是 Li 一 AK, 的 一 组 基 , 则 每 个 w 都 可 以 写成 w; = Au;, 其 
中 € Ki i 二 1,2,…,k, 且 wyws,… ,Us 是 Ks 的 一 组 基 . 设 mm V2 be Bu ,s,s 
u: 的 过 渡 和 矩阵 为 Gi， 则 


Vi = Alu sU2 ,°° Ue) == A(y yyY2 9 ) GG 一 AV,G, 


从 而 B= WiAVi 二 (AViG1) TAVi 二 GL (AV1)T(AV1)，, 其 中 (AVi)T(AVY,) 二 0, 注意 到 
G 可 逆 , 因 此 和 矩阵 如 是 可 逆 的 . 
GMRES 法 之 所 以 被 命名 为 广义 极 小 残余 算法 ,是 因为 按 这 种 选取 方式 ,并 基于 
Galerkin 原理 计算 近似 解 x, 等 价 于 用 x 在 x 十 Ks 中 极 小 化 RCx) == 上 7 一 4Axzl|3. 
定理 6.3.4 用 GMRES 法 得 到 的 近似 解 极 小 化 R(x) = |b 一 Ax|, 即 


R(X) = minR(x) 
其 中 ,xzEx' 二 xe. 
证 明 : 对 任意 x € x 十 Ki， 显然 有 
R(x)= |b—Ax|i = |(b— AxX)— ACx x)|? 
= R(X) —2(b—Ax,A(x—Xx))++|AC(x— x) | 
= R(X) + |AC(x— x)|? > ROX) 
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其 中 利用 了 (5 一 AX,A(x 一 Xx)) 一 0. 这 是 因为 此 时 A(x 一 xX) E L4 二 A Ki， 因此 根据 
Galerkin 原理 , A(x 一 X) 与 6 一 AXx 正 交 . 这 就 证 明了 定理 的 必要 性 . 充分 性 的 证 明 留 作 练 
习 . 证 毕 . 

我 们 仍 用 Arnoldi 过 程 来 构造 Kx 的 正 交 基 m ,m，…w. 对 任意 x Ex 十 Ki， 有 
z 二 x 一 x E Kk ,因此 存在 y € R*, 使 得 z 二 Viy, 从 而 


lb—Axl:= |b—AC(x® + = |r® —Azl; = |r® —AvViyl; 


ee = Weer Hy|; = | Bw — Va Hyl; 
-= |BVene —ViuHy |， = [Va (Bel — Hy)|; 
= | Be — Hy|; 


其 中 , el 二 (1,0,…,0) 7 € 民 外 ,另外 ,最 后 一 个 等 号 利用 了 习题 5. 23. 这 样 在 
x'0 十 Ki 中 极 小 化 RC(x) 也 就 是 在 Ki 中 极 小 化 | poe — Hoyli. 

当 太 很 大 时 ,Aroldi 过 程 非常 耗 时 ,而 且 Vi 和 了 玉 的 存储 量 也 很 大 . 对 于 大 型 方程 组 ， 
可 限制 & 的 最 大 值 为 m 二 nn, 即 取 固 定 的 mm, 周期 性 地 重新 开始 ,这 就 得 到 了 GMRES(m) 法 . 

Matlab 中 提供 了 内 置 函数 gmres, 可 用 于 求解 线性 方程 组 hx 王 b, 其 语法 为 


X= gmres(A,b,m,tol,maxit) 


其 中 m 用 于 指定 循环 周期 ,tol 用 于 指定 计算 精度 , 缺 省 值 是 10“, maxit 用 于 指定 最 大 
迭代 次 数 , 缺 省 值 是 min(n/m,20). 


6.3.3 那些 年 ,那些 事 


“那些 年 ,那些 事 ”, 主角 当然 是 “那些 人 ”参与 发 现 “20 世纪 十 大 算法 ”之 Krylov 子 空间 
迭代 法 的 ,的 确 是 "那些 人 ”他 们 中 ,有 英 年 早 逝 的 天 才 , 有 城防 工事 的 主管 ,有 海军 学 院 的 
将 军 , 有 誉 满 全 球 的 “隐士 >, 有 谦逊 待人 的 智者 ,还 有 抽象 与 计算 并 长 的 先锋 人 物 . 

英语 里 面 有 个 有 趣 的 短语 "agree to disagree”, 意 思 是 “保留 各 自 意见 ,接受 分 歧 的 存 
在 ”, 而 不 是 “同意 反对 ”. 而 它 最 初 的 流行 是 拜 两 位 著名 科学 家 所 赐 . 1908 一 1909 年 间 , 里 
兹 (Walther Ritz, 见 图 6- 3) 和 爱 因 斯 坦 就 黑体 辐射 的 数学 表示 及 热力 学 第 二 定律 的 理 
论 起 源 多 次 展开 激烈 争论 . 最 后 双方 仍然 各 执 已 见 , 于 是 两 人 正式 发 表 声 明 ,表示 “agree 
to disagree”. 

提出 Ritz 原理 的 正 是 这 位 天 才 里 效 . 1897 年 他 进入 苏黎世 理工 学 院 (ETH), 初 习 工 
程 , 后 修 物理 ,从 而 成 了 爱 因 斯 坦 的 同学 . 由 于 染 上 肺结核 ,1901 年 他 转 入 气候 更 适宜 的 
哥 廷 根 , 师 从 希 尔 伯 特 ,毕业 论文 涉及 预测 原子 特征 谱 线 的 数学 表达 式 . 1908 年 ,他 出 版 
长 篇 巨著 ,批评 麦克 斯 韦 - 洛 伦 效 电磁 理论 , 认为 该 理论 与 “发 光 的 以 太 ” 的 联系 “本 质 上 
不 适合 于 表示 电动 力学 传播 的 复杂 规律 ”, 并 认为 光 在 媒介 中 不 是 被 传播 而 是 被 反射 . 和 
爱 因 斯 坦 论战 后 不 久 , 他 就 因 肺 结核 去 了 “更 高 级 的 法 庭 ”. 

伽 辽 金 (Boris Galyorkin Galerkin, 见 图 6-4) 的 主要 贡献 在 有 限 元 上 ,Galerkin 原理 
当然 是 以 他 的 名 字 来 命名 的 . 从 1893 年 起 他 就 读 于 圣彼得堡 大 学 力学 系 . 在 就 读 期 间 ， 
他 积极 参加 政治 活动 ,并 于 1899 年 加 入 俄国 社会 民主 工党 . 1905 年 , 因 组 织 工程 师 罢 工 
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图 6- 3 里 兹 (1878 一 1909) 图 6- 4 催 了 金 (1871 一 1945) 图 6- 5 克 震 洛 夫 (1863 一 1945) 


Frog $ji Fujino 《本 于 se Hiroshimere ,了 Pp: 
Barer Yad， 六 fob 9 站 从 -从 : 扒 000 
Foldi 


Subjour VEIT 


图 6- 6 阿 诺 尔 德 逝世 的 消息 图 6- 7 赫 斯 索尼 斯 (1906 一 ]991) 图 6- 8 斯 蒂 费 尔 (1909 一 1978) 


而 被 捕 人 狱 . 在 狱 中 ,他 开始 研究 科学 和 工程 问题 . 出 狱 后 的 1908 年 ,他 发 表 了 在 狱 中 写 
成 的 长 文 (该 文 有 130 页 ,标题 也 很 长 ). 
到 了 1915 年 , 伽 辽 金发 文 ,提出 了 用 逼近 法 求解 微分 方程 尤其 是 边 值 问 题 的 思想 ， 
这 区 别 于 他 的 同事 布 勃 诺 夫 (Ivan Grigoryevich Bubnov,1872 一 1919 ,俄罗斯 海军 工程 师 
和 潜艇 设计 师 ) 早 前 提出 的 方法 . 布 勃 诺 夫 的 方法 被 他 本 人 视 作 Ritz 方法 的 变 体 , 而 伽 辽 
金 则 将 自己 提出 的 方法 看 成 适用 于 更 一 般 的 微分 方程 的 求解 ,而 不 是 局 限于 特定 的 变 分 
问题 . 事实 上 ,他 用 可 能 的 位 移 原理 解释 了 自己 的 方法 . Galerkin 方法 以 及 Galerkin 微分 
方程 问题 很 快 传 遍 了 全 世界 ,如 今 它 们 已 成 为 力学 .热力 学 .电磁 学 流体 动力 学 等 学 科 
中 的 算法 基础 到 了 20 世纪 20 年 代 , 他 已 经 是 世界 闻名 的 科学 家 ,在 工程 设计 师 中 有 很 
高 的 名 望 . 1936 年 ,他 被 选 为 苏联 科学 院 院 士 . 1941 年 ,纳粹 兵临城下 ,作为 应 对 ,列宁 格 
勒 市 政府 组 建 了 城防 工事 委员 会 ,他 成 了 该 委员 会 的 实际 负责 人 . 后 来 ,他 被 转移 到 莫 斯 
科 , 并 加 入 了 苏联 科学 院 的 军事 工程 委员 会 . 繁重 的 工作 损害 了 他 的 健康 . 二 战胜 利 后 不 
入, 他 在 莫斯科 去 世 . 
雷 洛 夫 (Aleksei Nikolaevich Krylov, 见 图 6-5) 是 苏联 著名 的 数学 家 ,力学 家 和 船 
舶 制造 专家 . 1888 年 他 考 人 圣彼得堡 海军 学 院 船舶 制造 系 ,在 切 比 雪夫 的 弟子 科 尔 金 
(Aleksandr Korkin,1837 一 1908) 的 严格 教导 下 ,仅仅 两 年 就 毕业 留 校 , 并 承继 了 科 和 尔 金 
的 衣钵 ,一 干 就 是 50 年 . 1900 年 被 委任 为 船舶 模型 实验 中 心 的 主任 后 ,他 做 了 大 量 工 作 ， 
涉及 船舶 的 浮力 稳定 性 滚动 与 俯仰 振动 .性 能 等 理论 以 及 罗盘 理论 ,实现 了 欧 拉 提 出 
的 “海军 科学 ”的 构想 . 1914 年 他 人 选 俄罗斯 科学 院 通讯 院士 ,1916 年 升 为 院士 . 1943 年 
因 罗 盘 理论 获 苏 联 国家 奖 . 他 的 女婿 卡 皮 查 (Pyotr L. Kapitsa, 1894 一 1984) 是 1978 年 诺 
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贝尔 物理 奖 的 获得 者 之 一 . 为 了 确定 力学 系统 的 振动 频率 , 克 雷 洛 夫 在 1931 年 的 一 篇 文 
章 中 建议 使 用 寡 法 产生 的 向 量 x,Ax ,42x,… 来 确定 特征 多 项 式 的 系数 ,从 而 找到 了 特征 
值 计算 的 新 方法 ,超越 了 拉 格 朗 日 、 拉 普 拉 斯 、 雅 可 比 等 前 辈 . 为 了 纪念 他 ,人们 将 
span{x,Ax ,A2*x,…} 命名 为 Krylov 子 空间 . 

如 图 6- 6 所 示 , 正 如 NA Digest (数值 分 析 文 摘 ) 中 所 言 : “几乎 所 有 的 数值 分 析 学 者 
都 是 通过 Arnoldi 过 程 知道 了 阿 诺 尔 德 的 大 名 .” 阿 诺尔 德 (Walter Edwin Arnoldi， 
1917 一 1995) 发 表 于 1951 年 的 文章 “The principle of minimized iterations in the solution of 
the eigenvalue problem” 如 今 是 数值 线性 代数 领域 被 引用 最 多 的 文章 ( 伟 怕 没有 之 一 ). 
正 是 在 该 文中 ,他 提出 了 Arnoldi 迭代 过 程 . 但 是 从 图 6-6 中 也 可 看 出 ,这 位 “隐士 "去世 
的 消息 几 个 月 以 后 才 为 学 术 界 所 知晓 . 关于 阿 诺 尔 德 ,我 们 只 知道 他 1937 年 毕业 于 斯 带 
文 斯 理工 学 院 机 械 工程 专业 ,两 年 后 进入 联合 航空 公司 (UAC) ,直至 1977 年 退休 . 另外 ， 
他 的 研究 兴趣 涉及 振动 建 模 、 高 速 数字 计算 机 以 及 航空 器 螺旋 桨 的 声学 分 析 和 气动 
分 析 . 

赫 斯 泰 尼 斯 (Magnus Rudolph Hestenes , 见 图 6-7) 如 今 因 CG 算法 而 被 大 家 所 熟 
知 ,尽管 他 本 人 谦逊 地 说 :“ 这 是 我 与 我 在 INA 的 同事 们 多 次 讨论 后 的 自然 结果 . ”这 里 的 
INA(Institute for Numerical Analysis) 位 于 加 州 大 学 洛杉矶 分 校 (UCLA). 自从 1947 年 
被 聘 为 UCLA 教授 后 ,直至 1973 年 退休 ,他 一 直 工 作 于 此 . 事实 上 ,CG 算法 是 他 多 年 研 
究 探 索 的 结晶 . 

赫 斯 泰 尼斯 的 研究 领域 是 变 分 理论 和 最 优 控 制 理论 ,这 极 大 地 影响 了 他 解决 数值 分 
析 问 题 的 方式 . 早 在 1935 年 ,他 就 引入 了 ” 共 恩 ?的 思想 ,次 年 发 展 出 构造 共 恩 基 的 一 种 
算法 . 因为 平淡 无 奇 ,哈佛 的 一 位 几何 学 教授 指出 这 达 不 到 发 表 要 求 . 但 赫 斯 泰 尼斯 意识 
到 共 轿 概念 有 很 好 的 几何 解释 ,而 且 几 何 中 或 许 隐藏 着 用 于 确定 椭 球 面 中心 的 方法 , 它 
与 共 斩 梯 度 法 是 等 价 的 .到 了 1951 年 ,他 更 是 撰文 ,用 二 次 型 讨论 变 分 问题 ,其 中 起 主要 
作用 的 是 他 引入 的 术语 “Q 正 交 ”. 

1949 年 , 赫 斯 泰 尼斯 受 邀 加 入 INA ,并 参与 了 一 个 “求解 线性 方程 组 以 及 和 矩阵 的 特征 
值 和 特征 向 量 ” 的 讨论 班 . 大 家 分 别 从 理论 和 计算 视角 讨论 了 已 知 的 各 种 求解 方法 ,并 借 
助 于 变 分 原理 和 几何 意义 ,将 线性 方程 组 的 求解 问题 转化 为 确定 机 球面 的 中 心 ,还 尝试 
了 各 种 步 长 . 两 年 后 ,为 参加 INA 举办 的 一 场 国际 研讨 会 , 赫 斯 泰 尼斯 被 大 家 公认 为 最 有 
权力 来 撰写 讨论 班 的 成 果 , 于 是 CG 算法 见 诸 于 文字 . 1954 年 ,由 于 CG 算法 ,他 荣获 古 
根 海 姆 奖 ,并 被 邀请 在 阿姆斯特丹 举行 的 国际 数学 家 大 会 上 做 报告 . 

斯 蒂 费 尔 (Eduard L. Stiefel, 见 图 6- 8) 不 仅 终 其 一 生 都 未 接受 过 纯 数学 与 应 用 数 
学 之 划分 ,还 一 直 致 力 于 两 者 的 融合 ,可 谓 理论 与 计算 并 长 的 先锋 人 物 . 1928 年 他 入 读 
瑞士 联邦 理工 学 院 , 并 于 3 年 后 获得 数学 学 士 学 位 . 1935 年 ,他 凭 流 形 上 的 向 量 场 的 基础 
研究 获得 ETH 博士 学 位 . 在 博士 论文 中 ,他 引入 了 著名 的 Stiefel 示 性 类 以 及 连续 群 的 
Stiefel 图 . 1943 年 起 他 被 ETH 聘 为 教授 ,并 在 1946 一 1948 年 间 担任 数学 和 物理 系 主 任 . 
为 实现 其 融合 数学 的 梦想 ,“ 大 权 在 握 ” 的 他 开始 大 施 拳 脚 ,于 1948 年 创立 了 应 用 数学 研 
究 所 ,以 推进 数值 分 析 研 究 . 同时 ,他 委派 助手 去 美国 学 习 当 时 最 新 的 计算 技术 . 次 年 ,他 
获悉 康 拉 德 ， 祖 萨 (Konrad Zuse,1910 一 1995, 独 立 开 发 出 世界 上 第 一 台 采 用 二 进 制 和 
布尔 逻辑 的 可 编程 计算 机 ) 发 明 出 Z4, 马 上 为 ETH 订购 了 一 台 . 借助 于 Z4 的 威力 ,ETU 


。262 。 矩阵 分 析 与 计算 


很 快 跻身 于 最 前 沿 的 数值 计算 中 心 之 列 , 而 且 还 在 1951 年 开设 出 计算 机 程序 设计 课程 

(包括 上 机 实习 ) ,这 在 欧洲 大 陆 尚 属 首次 . 斯 蒂 费 尔 和 他 的 助手 们 也 陆续 收获 了 qd 算 

法 .ALGOL 语言 和 CG 算法 等 突破 性 成 果 . 为 了 造 出 瑞士 第 一 台 计 算 机 ERMETH ,他 于 

1951 年 赴 美 交流 ,并 参加 了 INA 的 研讨 会 . 一 看 到 赫 斯 泰 尼斯 的 大 会 报告 ,他 吃惊 地 发 

现 这 也 是 他 的 演讲 主题 ,而 且 他 已 经 在 Z4 上 成 功 地 实现 了 这 种 算法 . 赫 斯 泰 尼斯 于 是 邀 

请 他 在 美 逗 留 一 个 学 期 ,这 样 两 人 合作 出 了 1952 年 那 篇 著名 的 论文 ,CG 算法 正式 问世 . 
还 有 一 位 重量 级 人 物 ,我 们 将 留待 下 一 章 再 请 他 出 场 ， 


_6.4 函数 矩阵 及 》 短 降 


由 于 向 量 和 数 都 可 看 成 特殊 的 矩阵 ,因此 函数 三 可 视 为 矩阵 4 E Cw 到 和 矩阵 B € 
Co 的 映射 , 即 映 射 f: Cw 户 CY%, 只 是 不 同 的 函数 依赖 于 不 同 的 m,n,p,g 以 及 不 
同 的 对 应 规则 . 

依据 定义 域 和 值 域 的 情形 ,可 以 将 f 大 致 分 为 如 下 四 种 情况 : 

(1) 普 通 函 数 : 定 义 域 是 数 集 , 值 域 也 是 数 集 ,比如 实 函 数 、 复 函数 等 . 这 就 是 传统 的 
函数 . 

(2) 标 量 函 数 :定义 域 是 和 矩阵 或 向 量 , 值 域 是 数 集 ,比如 行列 式 、 秩 、 二 次 型 . 迹 、 范 数 
等 . 这 时 的 了 显然 也 符合 传统 意义 上 的 函数 概念 . 

(3) 函 数 和 矩阵: 定义 域 是 数 集 , 值 域 是 矩阵 或 向 量 , 比 如 梯度 、》 和 矩阵 等 . 

4) 矩阵 值 函数 :定义 域 是 矩阵 或 向 量 , 值 域 也 是 矩阵 或 向 量 , 比 如 初等 变换 .相似 变 
换 、 和 矩阵 多 项 式 和 抢 阵 指数 函数 等 矩阵 函数 . 求 特 征 值 . 求 主 元 列 ,等 等 . 

标量 函数 我 们 已 经 比较 熟悉 ,本 节 和 下 一 节 我 们 分 别 探讨 函数 矩阵 和 矩阵 函数 . 


6.4.1 函数 和 矩阵 


同 前 面 一 样 ,我 们 既 可 以 从 微观 的 元 素 层面 来 处 理 函 数 矩 阵 , 也 可 以 从 宏观 的 算 子 
层面 来 研究 函数 矩阵. 我 们 仍然 灵活 使 用 这 两 种 视角 来 建立 函数 矩阵 的 微 积 分 ,但 更 多 
地 使 用 后 者 ,因为 它 不 仅 简单 ,而 且 还 能 揭示 概念 形成 的 模式 . 

定义 6.4.1 称 痉 义 ? 阶 矩阵 4 人 GO = (Co (b9) 为 妇 色 交 阶 的 函数 矩阵 (function 
matrix) ,其 中 的 元 素 aj (2) Gi 二 1,2,……,73j 一 1,2,…,7) 为 数 域 RR 上 关于 实数 zt 的 

特别 地 , 当 mm 二 1 时 A(z) 是 一 个 函数 行 向 量 ; 当 n 二 1 时 A(z) 是 一 个 函数 列 向 量 . 两 
者 统称 向 量 函 数 (vector-valued function). 

显然 函数 矩阵 4(z) 是 实数 域 R 到 矩阵 空间 C” 的 映射 ,向 量 函 数 x(z) 则 是 实数 
域 民 到 向 量 空间 C" 的 映射 ,因此 有 些 书 中 将 前 者 称 为 矩阵 值 函数 ,将 后 者 称 为 向 量 值 
函数 . 

另外 ,在 本 小 节 中 ,为 避免 叙述 繁琐 ,我 们 限定 了 : 为 实数 ,但 这 并 不 意味 着 不 存在 定 
义 在 C 上 的 函数 矩阵 ,比如 下 一 小 节 的 ) 和 矩阵 . 

若 视 函数 矩阵 4(bO 中 的 元 素 ai (1) 为 " 数 ”, 即 将 上 固定 , 则 函数 矩阵 的 加 法 ` 数 乘 、 乘 
法 、 转 置 与 常数 和 矩阵 的 相应 运算 相同 , 方 函数 矩阵 的 行列 式 计算 与 常数 和 矩阵 也 相同 . 
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定义 6.4. 2 ”如 果 对 nn 阶 函数 矩阵 A(W), 存在 n 阶 函数 矩阵 BCz)，, 使 得 
A(DB() 一 有 (DOD4(CD) = (6. 4. 1) 


则 称 x 阶 函数 矩阵 A(z) 是 可 逆 的 (inverse) ,并 称 B(7) 为 A(7) 的 道 和 矩阵 , 记 为 B(1) 一 
7 人 人 
定理 6.4.1 nn 阶 函 数 和 矩阵 AQ2) 在 La,b] 上 是 可 道 的 , 当 且 仅 当 A(z) 的 行列 式 


14(o) | 在 La,65] 上 不 处 处 为 零 , 且 4 (CD = AT aA), 这 里 adjA(z) 为 A(z) 的 伴 
随 矩 阵 . 
] 
特别 要 注意 其 中 的 条 件 “ 不 处 处 为 零 ”例如 4(O) = (” ，) 在 [2,3] 上 是 可 道 的 ,但 


在 [0,2] 上 却 不 是 可 逆 的 ,因为 当 上 一 1 时 14(CoO| 一 0. 

定义 6.4.3 设 有 函数 矩阵 4(D) = (az (7))wxn， 如 果 函 数 oj (21) (i = 1,2,…,m; 
7 一 1,2, 2) 在 上 一 加 处 都 有 极限 w， 则 称 函 数 和 矩阵 4(D 在 t= 二 处 有 极限 4 = 
《ay )mwa， 记 为 lim4(0) 二 A. 如 果 A(1) 一 A, 则 称 函数 矩阵 4C2) 在 上 一 wo 处 连续 . 


使 用 宏观 视角 ,可 重新 给 出 如 下 定义 . 

定义 6.4.4 设 有 函数 矩阵 4(2). 如 果 lim|4(7) 一 A1 二 0, 则 称 函数 矩阵 A(z) 在 
t=to 处 有 极限 4， 记 为 limA(2) 三 A. 如 果 A(1o) = A, 则 称 函 数 和 矩阵 4(Ci 在 :一季 处 
连续 . 

易 知 函数 和 矩阵 求 极限 的 加 减法 、 数 乘 、 乘 法 等 运算 法 则 与 函数 极限 的 相应 运算 法 则 
相同 . 实际 上 ,后 者 可 视 为 前 者 的 维 数 退化 为 1 X 1 时 的 情形 , 即 前 者 的 特殊 情形 ;前 者 是 
后 者 在 矩阵 维 数 上 的 推广 ,这 种 推广 保留 了 后 者 的 许多 性 质 . 

定义 6.4.5 设 有 函数 矩阵 4() = (aj (1) )w。 如果 每 个 元 素 a; (7) 在 点 上 都 可 微 ， 
则 称 函 数 矩 阵 4(D 在 点 寺 可 导 或 可 微 , 称 矩阵 (az (7)),w 为 其 导数 ,并 记 为 4 (CD 或 


dy). 


drt 
定义 6.4.6 若 函 数 和 矩阵 4(5 在 区 间 (a,65) 内 每 一 点 都 可 导 , 则 称 A(z) 在 (4a,6) 内 
可 导 或 可 微 . 


联想 到 普通 函数 /0) 的 导数 广 (0) 满足 jim| 十 包 一 Ac 一 (4) | 一 0, 我 们 可 


给 出 函数 矩阵 可 微 的 宏观 视角 . 
定义 6.4.7 已 知 函 数 和 矩阵 A(2), 符 函 数 和 矩阵 BO(2) 满足 


A(t+h)—A() 
h 


lim B(1) | = 人 0 
h—>0 


则 称 函 数 矩 阵 A(D 可 微 或 可 导 , 称 BCz) 为 ACD 的 导数 ,并 记 为 4'(z) 或 AG). 


函数 矩阵 的 导数 运算 也 具有 许多 与 普通 函数 的 导数 运算 相同 的 性 质 , 即 它 仍然 保留 
了 后 者 的 许多 性 质 . 
定理 6. 4. 2 (线性 运算 法 则 ) 
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(1) 两 个 可 导 函 数 之 和 仍然 可 导 , 上 且 (4(z) 士 了 CD) 一 4 (CD 士 瑟 (CD 
(2) 可 导 函 数 的 常数 倍 仍然 可 导 , 征 (4 (1))" = kA'(7); 

(3) 若 矩阵 4 与 上 无 关 , 则 (4B(7)) = 4B (1). 

定理 6. 4. 3 (乘积 求 导 法 则 ) 

(1) 可 导 的 普通 函数 与 可 导 的 矩阵 函数 的 乘积 仍然 可 导 , 且 


(RC(1)AC)) = (A +k(0A’ C0) 
(2) 两 个 可 导 的 函数 矩阵 之 积 仍然 可 导 , 且 

[A(WB()] = A (BG) 十 4(CDB CD) 
(3) 若 妈 二 f(2) 是 1 的 可 导 函 数 , 则 


d 二 lh 
SA = f(D EAC 


(4) 两 个 可 导 的 向 量 函 数 的 内 积 仍然 可 导 , 且 
(XD ,YC2) = Cx 2) ,0)) Cx) , y CD) (6. 4. 2) 
道 和 矩阵 的 情况 又 如 何 ? 对 式 (6. 4. 1) 两 边 求 导 , 可 知 
4 BO 十 4ACGD)B CD 一 (BCD4ACD) = (1,) 一 O 


因此 也 (D 一 一 4 (DA (DB(CD). 
定理 6. 4.4 〈 逆 求 导 法 则 ) 设 A(z) 是 可 逆 的 可 导 和 矩阵 , 则 4 2(z) 也 可 导 , 并 且 

[A (CD] 一 一 人 (4 CD。 4 
特别 地 , 当 A(z) 退化 为 1X1 阶 的 函数 f(z) 时 ,上 式 即 为 

[FT =— FS DF DA 
遗憾 的 是 , 微 积 分 的 链 式 法 则 对 函数 矩阵 并 不 成 立 . 例如 对 函数 p(4) = A? (7)，, 显然 
[A?(2)] = A AC)TAC) :AC) 天 24(0 Ab) 

当然 ,我们 也 注意 到 ,车 补充 条 件 A(z) A(z) = A(7)，A'(2)，, 则 链 式 法 则 成 立 , 即 
d 


TD 


定义 6. 4.8 设 有 函数 矩阵 A(1), 如 果 A'(1) 仍然 是 可 导 的 函数 矩阵 , 则 称 函 数 矩 
阵 4() 二 阶 可 导 或 二 阶 可 微 , 称 所 4'(?) 为 其 一 阶 导数 , 记 为 &Cz) 或 AC). 

一 般 地 ,不 难 定义 函数 矩阵 的 高 阶 导数 . 

例 6.4.1 ， 设 函数 矩阵 4C) = (， jc 天 0), 求 LA3CD] 


Sp(A) = WAY s 


£2 
0 
解 :由 于 函数 和 矩阵 4(D 是 2 阶 的 ,所 以 我 们 使 用 定理 6. 4. 1. 因为 
1 | 0 | | | | 
4 (ti) 一 adjA(1) 一 一 一 
l= 1 2 


| 
|ACz)| 
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= 
所 以 [A710)] = | as | (t 0). 


— 2 

例 6.4.2 设 nn 阶 函数 矩阵 A(1) = (os (7)), 证明 [tr4(2)] = trA’ (7). 

证 明 : [trA4 C2)] 二 [aa GD 十 …… 十 ao 人 (一 aa GD 十 …… 十 at) 一 tr4A 5. 证 毕 . 

此 例 意味 着 求 迹 运算 与 求 导 运 算 可 以 交换 次 序 . 注意 到 和 矩阵 的 迹 是 线性 的 标量 也 
数 , 即 

tr(kA) = ktr(A), tr(A+B) = tr(A)+tr(B) 

那么 ,对 任意 的 线性 标量 函数 1 二 1(4(2)), 是 否 仍然 成 立 [1C4A(CD)] = 二 1(4' (7)) 呢 ? 
事实 上 ,可 以 证 明 这 种 推广 也 是 正确 的 . 

下 面 我 们 考察 函数 矩阵 的 积分 . 

定义 6.4.9 设 有 mXn 阶 函数 算 阵 A(z) = (ao (7)),xs， 如果 A(z) 的 每 个 元 素 


wu (0 都 在 [a, 轨 上 可 积 , 则 称 卫 数 甜 阵 A(z) 在 [a, 幻 上 可 积 ,并 称 箱 阵 (ay CDdt) 


mxXn 


为 其 积分 , 记 为 | ACDdi. 


容易 验证 函数 矩阵 的 积分 具有 下 列 性 质 : 
定理 6. 4. 5( 线 性 运算 ) 设 A(z) 和 BC) 都 在 [a,5] 上 可 积 , ,wwE C，, 则 


| Daco +pB (Jd = 4| 4CDd 二 ze| Bod 
定理 6. 4. 6 〈 乘 积 运算 ) 设 4(z) 在 [a,5] 上 可 积 , P,Q 为 常数 矩阵 , 则 
|P.4OD .ou =P.| ad .9 
定理 6. 4.7 〔 微 积分 基本 定理 ) 设 A(z) 在 [a,6] 上 连续 , 则 对 任意 +€ (a,b), 有 


和 记 
| Als)ds = A() 


定理 6. 4.8 (牛顿 - 莱 布 尼 兹 公式 ) 设 A'(7) 在 [ae,o] 上 连续 , 则 


pb 
| A’wWat = A 


例 6.4.3 设 函 数 矩 阵 4(z) = (， 1, 求 | Ad 


dr £2 dz 
解 : | 4Cd = | | = ( 
,td 0 
类 似 地 ,可 以 定义 函数 矩阵 的 不 定 积分 ， 
Matlab 中 提供 了 内 置 函 数 diff, 除 了 具备 数值 微分 计算 功能 外 ,也 可 用 于 对 符号 表 
达 式 进行 微分 运算 . 就 符号 计算 而 言 ,函数 diff 的 调用 格式 有 以 下 几 种 ， 
(1)diff(expr, v) 和 diff(expr，sym(Cv)) 对 表达 式 expr 关于 自 变 量 v 求 导 , 其 中 的 
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自 变 量 v 可 由 symvar 缺 省 指定 ; 

(2)diffCexpr，n) 对 表达 式 expr 求 n 阶 导 数 , 缺 省 为 n 一 1; 

(3)diffCexpr，v, n) 和 diff(expr, n,， Vv) 对 表达 式 expr 关于 自 变量 v 求 n 阶 导 数 , 缺 
省 同 前 . 

注意 ,这 里 的 表达 式 expr 既 可 以 是 多 元 函数 ,也 可 以 是 函数 和 矩阵、 后 文 要 介绍 的 含 参 
符 阵 函数 (本 质 上 也 是 函数 矩阵) 等 符号 矩阵 . 

Matlab 中 也 提供 了 内 置 函数 int, 可 用 于 求 数值 积分 和 符号 积分 ,调用 格式 为 


int(fyvy) int(Esveyarb)s 
但 Matlab 将 来 会 取消 这 种 调用 格式 ,而 代 之 以 更 严格 的 intCsym(f),. .. ). 
6.4.2 1 和 矩阵 及 其 Smith 标准 型 


对 4 和 矩阵 ,我 们 并 不 陌生 .事实 上 ,和 矩阵 4 的 特征 矩阵 MT 一 4 就 是 最 典型 的 4 矩阵 . 利 
用 1 矩阵 ,我 们 可 以 得 到 常数 矩阵 Jordan 标准 型 的 另 一 种 计算 方式 ,与 2.5 节 给 出 的 基 
于 空间 分 解 的 算法 相 比 , 正 可 谓 “ 殊 途 同 归 ?” 

定义 6.4.10 设 有 函数 矩阵 4(A) 二 (aj (4)),ws， 如果 其 元 素 az (4) 都 为 数 域 FF 上 关 
于 字母 4 的 多 项 式 函 数 , 则 称 A(X) 为 1 矩阵, 

这 里 使 用 字母 4 而 不 是 字母 zx 来 表示 未 知 数 只 是 历史 的 习惯 . 当 我 们 将 4 固定 时 , 同 
样 将 4 矩阵 特殊 化 为 常数 矩阵 . 

由 于 关于 4 的 多 项 式 的 和 、 差 积 仍然 是 4 的 多 项 式 ,因此 4 和 矩阵 的 和 、 差 . 数 乘 ,乘积 
仍然 是 4 矩阵 . 

定理 6. 4. 9 4 和 矩阵 AQ) 可 逆 的 充 要 条 件 是 其 行列 式 为 非 零 的 常数 , 即 | AQ) | == c 关 0. 

证 明 : 必 要 性 . 设 函 数 和 矩阵 4(A) 可 道 , 则 有 矩阵 BG)，, 使 得 


A(2)BGQ) = BQ)AGQ) = I 


两 边 取 行 列 式 , 并 由 柯 西 定理 可 知 |4GQ)|. |BGQ)|= | 如 三 1., 因 此 |4Ww)| 与 |1BGQ)| 都 
只 能 是 4 的 零 次 多 项 式 即 常数 , 即 | A() | 为 非 零 的 常数 . 

充分 性 . 设 |4G)|1=c 和 0, 则 由 定理 6. 4. 1 可 知 和 矩阵 4(A) 可 道 , 从 而 其 道 矩阵 为 
c adj4(), 显然 这 也 是 一 个 ) 矩阵 . 证 毕 . 

矩阵 的 初等 变换 是 化 简 和 矩阵 的 重要 工具 ,我 们 自然 也 将 之 引 和 人 到) 矩阵 之 中 . 

定义 6.4.11 对 4 和 矩阵 A (4) 的 初等 变换 指 的 是 下 列 三 种 变换 : 

(1) 交 换 变 换 , 即 交换 矩阵 4(A) 的 i, 两 行 ( 列 ), 记 为 rj (ci ); 

《2) 数 乘 变换 ,即将 AG) 的 第 i 行 ( 列 ) 乘 以 非 零 常数 k, 记 为 ri;(k) (ci;(k) ); 

(3) 信 加 变换 ,即将 AQ) 的 第 i 行 ( 列 ) 乘 以 多 项 式 p(X) 后 加 到 A) 的 第 j 行 ( 列 )， 
记 为 ry (9) (cs (9p) ). 

定义 6.4.12 如 果 4 和 矩阵 A(X) 经 过 有 限 次 的 初等 变换 化 成 4 矩阵 B(X), 则 称 和 矩阵 
AQ) 与 也 OA) 等 价 , 记 为 4) ~ BOQ). 

定理 6.4.10 4 和 矩阵 AQ) 与 BQ) 等 价 的 充 要 条 件 是 存在 可 道 和 矩阵 PQ) .QQ@), 使 得 


BO) = PQ)A()ON) 
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证 明 : 略 . 

对 上 式 两 边 求 行列 式 , 并 注意 到 |PQ)| 和 180)| 都 是 非 零 的 常数 , 因此 
1BQ)| 是 14Q)| 的 常数 倍 , 即 等 价 的 4 和 矩阵 的 行列 式 只 能 相差 一 个 常数 因子 . 

定理 6. 4. 10 的 结论 显然 与 常数 矩阵 一 致 . 事实 上 ,作为 常数 矩阵 的 推广 , A 矩阵 还 有 
许多 与 常数 矩阵 类 似 的 性 质 ,比如 下 面 的 标准 型 ; 

定义 6.4.13 形 如 下 面 的 mXn 阶 * 矩阵 


J0) = | DG) 一 diag(di CO) ,dM) ,dd,(A)), 0Zr< min(m,n) 


称 为 Smith 标准 型 (Smith normal form) ,其 中 非 零 “ 对 角 元 ”di1(4) ,qd; (4),…,d,(4) 都 是 
首 项 系数 为 1 的 多 项 式 ( 称 为 首 一 多 项 式 ) ,并 且 尺 GO) | din1(0),i= 二 1,2,…,r 一 1. 
定理 6.4.11 任意 mXn 阶 的 4 和 矩阵 4AG) 都 有 一 个 等 价 的 Smith 标准 型 J(CA). 

定理 的 证 明 需 要 一 个 引 理 . 

引 理 6.4.1 设 A4 和 矩阵 A (4) 左上 角 的 元 素 an CQ) 和 天 0, 上 且 4(G) 中 至 少 有 一 个 元 素 不 
能 被 ca (4) 整除 , 则 一 定 可 以 找到 一 个 与 等 价 的 4 矩阵 BG)，, 其 左上 角 元 素 CA) 关 0， 
且 CA) 的 次 数 比 an Gy) 的 次 数 低 . 

证 明 : 根 据 4(A) 中 不 能 被 整除 的 元 素 所 在 的 位 置 ,分 三 种 情况 讨论 . 

(1) 在 A() 的 第 一 列 中 有 一 个 元 素 wa (4) 不 能 被 整除 , 即 有 aa (24) = an (XA)g(4) 十 
r(4)，, 其 中 余 式 r(2) 关 0, 且 其 次 数 比 aa (4) 的 次 数 低 . 

对 A(A) 作 两 次 初等 行 变换 : 先 执行 倍加 变换 7 一 二) 9 将 Cas) 位 置 上 的 元 素 an (A) 
变 成 r(X4)，, 再 执行 交换 变换 ni;, 将 (i,1) 位 置 上 的 元 素 r(X) 交换 至 (1,1) 位 置 , 即 得 所 
求 的 BO). 

(2) 在 A() 的 第 一 行 中 有 一 个 元 素 cv (4) 不 能 被 整除 . 这 种 情况 与 (1) 类 似 . 

(3) AQ) 的 第 一 列 和 第 一 行 中 的 元 素 都 可 以 被 ca (4) 整除 ,但 在 其 他 位 置 有 一 个 元 
素 aj (4) (i,; 二 1) 不 能 被 ai (4) 整除 . 

设 oa) 二 an (Xgl2). 对 AG) 作 两 次 初等 行 变换 : 先 执行 倍加 变换 ni;( 一 yp)，, 将 
(i,1) 位 置 上 的 元 素 aa (4) 变 成 0, 此 时 (i,7) 位 置 上 的 元 素 aj (24) 变 成 了 a; GO) 一 
au (4)g(4); 再 执行 倍加 变换 ra (1), 此 时 (1,1) 位 置 上 仍然 是 aa (CA), 但 (1.7) 位 置 上 
则 变 成 了 b 二 aj (40) 十 a (0)(1 一 g(00)), 显然 不 能 被 cu CQ) 整除 (否则 aj (2) 能 被 
an (4) 整除 ,出 现 矛 盾 ). 这 就 变 成 了 (2) 的 情形 . 证 毕 . 

证 明定 理 6. 4. 11: 设 aa (1) 和 0, 否则 总 可 以 经 过 行列 调整 ,使 得 4C) 左上 角 的 元 
素 不 为 零 , 

若 ca CA) 不 能 整除 A(X) 的 所 有 元 素 , 则 由 引 理 6. 4. 1, 可 以 找到 与 4AG) 等 价 的 和 
矩阵 Bi (4), 其 左上 角 元 素 b1(4) 关 0, 并且 次 数 比 wa (4) 的 次 数 低 . 如 果 5.0) 还 不 能 
整除 Bi CA) 的 所 有 元 素 , 则 由 引 理 6. 4. 1, 可 以 继续 找到 与 A(X) 等 价 的 A 矩阵 B, (4)， 
其 左上 角 元 素 6,(4) 天 0, 并 且 次 数 比 51(X) 的 次 数 低 …… 由 于 多 项 式 的 次 数 是 非 零 整 
数 , 因 此 在 有 限 步 之 后 ,一 定 会 得 到 一 个 与 A4(X) 等 价 的 4 和 矩阵 B,(X), 其 左上 角 元 素 
b,(4) 可 以 整除 B,(X) 的 所 有 元 素 , 并 且 是 非 零 的 首 一 多 项 式 . 记 di (4) = 6b.(A), 显然 
此 时 可 对 B.(X) 做 一 系列 初等 变换 ,将 其 第 一 行 和 第 一 列 除 左上 和 角 元 素 di (4) 外 全 变 
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成 零 , 即 


cd) 0 
也.(A) ~ 


0 Ai(A) 


因为 (mr 一 1) X (一 1) 阶 矩 阵 A1(4) 的 元 素 是 B,(X) 的 元 素 的 组 合 , 而 6.(24) 即 
di(4) 可 以 整除 B,(4) 的 所 有 元 素 , 因 此 d1(4) 能 整除 4 CA) 的 所 有 元 素 . 
如 果 Ai(4) 关 0，, 则 对 4 CA) 重复 上 述 过 程 , 可 得 


di (1) 
一 dz (1) 


Ci CA) 07 
及,(A) 一 


0 AQ0) 
A, (A) 
其 中 , di1(4) 和 4d; (4) 都 是 首 一 多 项 式 , 并 且 di (4) | d; (4), 而且 dz(4) 能 整除 A; (4) 的 
所 有 元 素 . 继续 上 述 过 程 , 4CA) 最 终 化 成 了 与 之 等 价 的 Smith 标准 型 JQ). 证 毕 . 
0 AGO 一 1) 0 
例 6.4.4 求 和 矩阵 4GQ) = | 0 4 十 1 | 的 Smith 标准 型 . 


0 0 一 名 十 2 
解 :对 和 矩阵 A() 进行 初等 变换 ,可 得 
0 XH 0 rz /A 0 A 十 1] cs( 一 1) [A 0 1 
AQ) 王 |A 0 A 二 1 |==10 XGA 一 也 0 ~ 0 AQ 一]1) 0 
0 0 一 为 于 汉 0 0 一 人 十 2 0 0 一 外 十 22 
C13 1 0 A ris(A—2) 7 0 A 
a=: XA—1) 0 0 CA 一 1) 0 (不 是 标准 型 !) 
_ 142 0 0 0 0 A = 
c13(—A) 1 0 0 razs (1) 1 0 0 
~ 0 AAA 一 1) 0 ~ |0 AQ 一 1) AQA 一 2) 
0 0 刘 统 一 思 0 0 A(A CO—2) 
czs(—1) {1 0 0 cz3 {1 0 0 
一 - 8 和 一 了 人 2 | 交 3 (A= 1 
0 0 A(A—2) 0 AMAGQA 一 2) 0 
rza (A CO— 2) 1 0 0 cza (AO— 1) 1 0 0 
~ OH 一 以 A2O—1) ~ OQ 一 站 0 
有 一 一 2 0 有 (一切 亿 一 功 


一 


0 A 0 
0 VO MA— DCO 2 


ra(— 1) 1 0 0 
三 J (A) 
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定义 6. 4. 14 和 矩阵 4GQ) 的 Smith 标准 型 J() 中 的 非 零 元 di CA) ,dz CA)，…， 
d,(4) 称 为 4(CA) 的 不 变 因 子 (invariant factor)， 

这 说 明 我 们 可 以 先 求 Smith 标准 型 ,再 来 确定 不 变 因子 . 比如 例 6. 4. 4 中 的 不 变 因 
子 就 是 1, A 和 X24 一 1) (4 一 2). 

为 了 确定 Smith 标准 型 的 唯一 性 ,我 们 需要 研究 和 矩阵 的 秩 和 行列 式 因子 . 

定义 6.4.15 1 和 矩阵 4GA) 中 不 为 零 的 子 行列 式 ( 即 子 式 ) 的 最 高 阶 数 +r 称 为 A (A) 
的 秩 , 记 为 x(4(4)). 零 矩 阵 的 秩 规定 为 零 . 秩 r(4(X)) 二 nn 的 n 阶 方 阵 A (4) 称 为 满 秩 阵 
或 非 奇 异 阵 . 

定义 6.4.16 4 矩阵 AQ) 的 所 有 非 零 & 阶 子 式 的 首 一 最 大 公 因 式 称 为 ACA) 的 上 
阶 行列 式 因 子 (determinantal divisor) , 记 为 D, (4). 

注意 不 要 将 抢 阵 的 行列 式 因 子 与 子 式 混 请 . 


例 6.4.5 AQ) 一 人 ,) 的 秩 为 2, BO) 二 ( 1 


_， ; ) 的 秩 也 是 2, CQ) 一 


六 入 二 1 
(5 “ 。 ) 的 秩 是 1 

AQ) 的 Di) 三 1,D:G) 王 和 对 BO) 的 Di() ==1,D;,(X) 一 人 ,至 于 CGOQ)，DiG) 
= DaGD = 1. 

可 以 证 明 , 初 等 变换 不 改变 4 矩阵 的 秩 , 即 等 价 的 4 和 矩阵 必 等 秩 ;反之 ,等 秩 的 和 矩阵 未 
必 等 价 . 例如 ,此 例 中 的 4 矩阵 4G) 与 BQ) 尽管 秩 相 等 , 却 不 等 价 ,因为 前 面 已 指出 ,等 
价 的 4 矩阵 的 行列 式 只 能 相差 一 个 常数 因子 ,而 矩阵 AQ) 与 BC) 不 满足 这 个 要 求 . 

既然 初等 变换 不 改变 4 和 矩阵 的 秩 , 那么 从 和 矩阵 A(4) 的 Smith 标准 型 J() 可 知 
r(A(4)) 就 是 J(X) 中 非 零 元 的 个 数 . 

定理 6. 4.12 等 价 的 4 和 矩阵 具有 相同 的 各 级 行列 式 因子 . 


证 明 : 略 . 
定理 6. 4. 13 和 矩阵 A() 的 Smith 标准 型 J(4) 是 唯一 的 ,并 且 
过 DW) 生 5 
dt = Dr lS D0 (k= 2,3,°,7) 


其 中 ， es r(A(X)). 
证 明 : 计 算 可 知 Di GD) = qi (2),D; (G2) = di (Xd; DO) = di QQ)qd; Qed,(N), 
此 即 


D, (CA) DD 
dW) = D0), di = Be 
这 说 明 A(X) 的 不 变 因 子 由 AG) 的 行列 式 因 子 唯一 确定 ,因此 J) 是 唯一 的 . 证 毕 . 

这 个 定理 说 明 我 们 也 可 以 用 行列 式 因 子 来 确定 不 变 因 子 , 从 而 得 到 唯一 的 Smith 标 
准 型 . 但 行列 式 因 子 的 计算 复杂 ,所 以 在 这 次 较量 中 ,通过 初等 变换 求 Smith 标准 型 显然 
“胜出 ” 回顾 线性 代数 中 求 常数 矩阵 的 秩 时 ,初等 变换 法 也 比 定义 法 简便 得 多 ,这 再 次 说 
明 “ 变 换 是 王道 ”. 

另外 ,这 个 定理 也 意味 着 当 和 矩阵 A() 为 满 秩 方 阵 时 ,由 于 AGQ) ~J(), 从 而 存在 非 
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零 常 数 c, 使 得 |4GQ)|= cl|JOQ)|= ca GO)…d (4), 即 每 个 不 变 因子 di (4X) 都 是 
行列 式 |A()| 的 因子 ,而 且 是 4C) 的 不 变量 ,这 也 正 是 其 名 称 的 由 来 . 

定理 6.4.14 和 矩阵 4G) 与 BG) 等 价 的 充 要 条 件 是 它们 有 相同 的 行列 式 因 子 ( 或 相 
同 的 不 变 因子 ). 

证 明 : 略 . 

在 例 6. 4. 4 中 ,不 变 因子 d; (4) = 二 4 一 1) 2 一 2) 可 被 分 解 为 三 个 一 次 因 式 的 乘积 ， 
这 些 一 次 因 式 起 什么 作用 呢 ? 

定义 6. 4.17 将 矩阵 4G) 的 每 个 非常 数 的 不 变 因 子 分 解 为 互 不 相同 的 一 次 因 式 方 
震 的 乘积 ,所 有 不 变 因子 的 这 些 一 次 因 式 的 方 寡 ( 相 同 的 按 出 现 的 次 数 计算 ) 称 为 A(2) 
的 初等 因子 (elementary divisor). 

例如 ,在 例 6. 4.4 中 , A() 的 不 变 因子 为 d1(2) = 1,d; Ga) = 二 4,d;(4) = 二 A(X 一 1) 
(一 2), 因此 AQ) 的 初等 因子 为 来 自 di(4) 的 A 以 及 来 自 4;Q) 的 4,4 一 1,4 一 2, 也 就 
是 4,A,4 一 1,4 一 2. 

例 6.4.6 和 矩阵 A() 的 不 变 因子 为 


di(2) = 1,di(0) =40C—1),d(0) =AQm—1D 十] 
dA) = QD a+1) m2) 


则 A() 的 所 有 初等 因子 为 1 一 1 一 1)2 ,0 十 1)252 一 1)3， 0 十 1)3 一 2. 
初等 因子 来 自 不 变 因子 ,如 果 知 道 矩 阵 4(A) 的 所 有 初等 因子 ,能 否 反 过 来 确定 相应 
的 不 变 因子 ?等 价 矩 阵 的 初等 因子 是 否 相同 呢 ? 
遗憾 地 是 , 仅 凭 初等 因子 不 能 唯一 地 确定 不 变 因子 . 例如 下 面 的 两 个 矩阵 A(X) 与 
BQ) 的 初等 因子 相同 ,但 不 变 因 子 不 相同 ,两 者 也 不 等 价 , 因 为 它们 的 秩 不 相等 : 


1 0 0 0 人 一 2 0 0 0 


Q 入 一 2 0 ， B(X) = 0 (X=2 0 8 


0 0 CA—2: 0 .0 0 0 


等 价 和 矩阵 的 初等 因子 显然 相同 ,但 反之 未 必 成 立 . 那么 再 补 上 什么 条 件 就 能 够 反 过 
来 确定 相应 的 不 变 因 子 ? 考虑 到 等 价 和 矩阵 的 秩 也 相等 , 反 过 来 秩 相 等 的 矩阵 也 未 必 等 
价 . 如 此 “同病相怜 ”的 两 个 条 件 合 在 一 起 后 ,情况 又 如 何 呢 ? 

定理 6.4.15 和 矩阵 4Q) 与 BQ) 等 价 的 充 要 条 件 是 它们 有 相同 的 初等 因子 ,并 且 秩 相等 . 

显然 ,矩阵 的 秩 确定 了 不 变 因子 的 个 数 . 同时 ,结合 例 6. 4. 6 可 知 ,同一 个 一 次 因 式 
(比如 4 一 1) 的 方 究 做 成 的 初等 因子 中 , 方 次 最 高 的 必 在 & Ga) 的 分 解 式 中 [比如 
(2 一 1)” 出 现在 ds CA) 中 ], 方 次 次 高 的 出 现在 4, 1 (4) 的 分 解 式 中 (比如 4 一 了 DD? 出 现在 
ds(4) 中 ) ,以 此 类 推 ( 比 如 剩 下 的 一 个 4 一 1)! 出 现在 心 () 中 ) ,可 知 属于 同一 个 一 次 
因 式 的 方 寡 的 初等 因子 在 不 变 因子 的 分 解 式 中 出 现 的 位 置 是 唯一 确定 的 . 

关于 等 价 矩 阵 AQ) 与 B() 与 其 各 种 因子 之 间 的 关系 ,如 图 6- 9 所 示 . 图 中 df$ (4)、 
DE (4) 及 e* (4) 分 别 表示 A(X) 的 不 变 因 子 、 行 列 式 因 子 和 初等 因子 , dq8(X), D8() 及 
e (4) 分 别 表示 BQ) 的 不 变 因子 ,行列 式 因 子 和 初等 因子 . 
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4(A) ~ B(N) 


D4(A) = D2(A) 


cdL(A) = de(A) - 
r(A(N)) = r(B(A)| ! 
1 


6-9 等 价 矩 阵 与 其 各 种 因子 之 间 的 关系 


例 6.4.7 求 1 和 矩阵 4AG) 的 Smith 标准 型 ,其 中 


么 一 和 ”一 0 ww = 0 
4G) = 0 A—a —1|=A—jJj(a),J(a)=|0 a 一 1 
0 0 A—a 0 0 a 
A—a 一 1 全 Br ol 有 一 < 0 
解 : A(2) 二 | 0 Xa 一 1 |~|X 一 a 0 一 1 
0 0 处 = 一 疡 0 0 A—a 
riz(A—a) [一 1 放流 0 lecw(A—a)(—1 0 0 
~ 0 QA—a): —1 ~ 0 QA—a): 一 1 
0 0 和 一 公 0 0 让 到 
C23 = 一 了 0 0 723 (一 Q&) 
一 | 0 一 六 一 如 说 i 


on 0 
0 =1 = 


0 A—a 0 0 0 QA—ay’ 


cza((A—a):){—1 0 0 1 0 0 
se 0 一 1 0 ~-|0 1 0 一 J (4) 
0 0 (A—a 0 0 (一 ac)3 


此 例 中 AQ) 的 不 变 因子 为 d1 (0) = 4d; (4) = 1,4d;() 二 0 一 a);, 则 初等 因子 为 
(2 一 a)”. 如 果 还 知道 A(X) 的 秩 为 3, 则 可 反 过 来 确定 A() 的 三 个 不 变 因 子 , 进 而 可 确 
定 AQ) 的 Smith 标准 型 J(4), 因此 也 可 唯一 确定 相应 的 Jordan 块 , 即 

QA—aoeA mJ(a)o J(a). 

一 般 地 ,借助 于 特征 矩阵 江 一 J,(a) 这 个 媒介 ,可 将 初等 因子 (4 一 a)" 与 Jordan 块 
几 (Ca) 一 一 对 应 起 来 . 

例 6.4.8 求 Frobenius 标准 型 C, 的 特征 矩阵 A 并 一 CG 的 Smith 标准 型 . 

解 : 设 C 的 特征 多 项 式 为 pg@) = | 一 GC | 二 和 一 pA 一 … pA—po = 0. 
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先 对 特征 矩阵 MT 一 C2 依次 执行 变换 721 (A) ral pp Tnl (A™ ), 再 依次 执行 m2» 
123 9""" 97 ln 将 第 一 行 轮换 为 最 后 一 行 , 即 


0 ga) 一 1 A = 
一 1 A — pi 一 1 
MT 一 C ~ = : 一 一 
A —pr2 一 上 A—pi 
一 了 入 一 .为 pA) 
接着 ,依次 执行 ca 02) ,czs C4),… ,ci (4) 以 及 其 他 列 变换 ,可 得 
一 1 —p 1 
一 1 1 
MT 一 C: 一 这 一 pz | 一 
一 1 A— pi 1 
pA) pA) 


因此 所 求 Smith 标准 型 是 对 角 和 矩阵 diag(1,1,…,1,g(X)) 
考虑 到 常数 矩阵 4 的 Jordan 标准 型 J 是 准 对 角 和 矩阵 ,因此 我 们 还 必须 考虑 准 对 角 
4 和 矩阵 的 初等 因子 与 其 各 对 角子 块 的 初等 因子 的 关系 . 


定理 6. 4. 16 矩阵 40) 一 人 Cj 的 全 部 初等 因子 就 是 BC) 和 CQ) 的 初 


等 因子 的 全 体 . 特别 地 , 当 B() 和 CC) 分 别 退化 为 多 项 式 CA) 和 clX) 时 , A(X) 的 全 部 
初等 因子 就 是 5) 和 c(4) 的 所 有 一 次 因 式 的 寡 积 . 
证 明 : 略 . 


6.4.3 Smith 标准 型 的 应 用 


前 面 我 们 已 看 到 ,寻找 与 常数 矩阵 4 相似 的 Jordan 标准 型 J 的 问题 ,已 转化 成 了 求 
其 特征 矩阵 并 一 A 的 Smith 标准 型 . 更 一 般 地 ,常数 矩阵 的 相似 可 以 归结 为 特征 矩阵 的 
相似 . 

定理 6.4.17 和 矩阵 A 与 B 相似 的 充 要 条 件 是 它们 的 特征 和 矩阵 2I 一 A 与 MT 一 已 等 价 . 

证 明 :我 们 只 给 出 必要 性 的 证 明 . 充分 性 的 证 明 请 查阅 相关 文献 . 

若 4c 了 8, 则 存在 可 逆 矩 阵 卫 , 使 得 P71AP 一 也 ,从 而 POT 一 人 )P 一 人 一 B, 由 于 
P ,了 都 是 可 逆 和 矩阵 ,因此 1 一 4 一 代 一 中 . 证 毕 . 

定义 6.4.18 分 别称 二 阶 矩阵 4 的 特征 矩阵 1MT 一 4 的 行列 式 因子 .不 变 因子 和 初等 
因子 为 矩阵 4 的 行列 式 因子 .不 变 因 子 和 初等 因子 . 

定理 6.4.18 和 矩阵 4 与 召 相 似 的 充 要 条 件 是 它们 有 相同 的 行列 式 因子 (或 不 变 因子 )， 

证 明 : 结 合 定理 6. 4. 17 与 定理 6. 4. 15 即 可 . 证 毕 . 

定理 6.4.19 复数 域 上 两 个 矩阵 4 与 孔 相 似 的 充 要 条 件 是 它们 有 相同 的 初等 因子 . 
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证 明 : 注 意 到 (GOT 一 4) = GOT 一 B) 一 2, 再 结合 定理 6. 4. 17 与 定理 6. 4. 14 即 可 . 
证 毕 . 
关于 相似 抢 阵 4 与 B 与 其 各 种 因子 之 间 的 关系 ,如 图 6 - 10 所 示 . 图 中 SGQ) 二 一 
A, T() 三 TI 一 B 分 别 表示 4 与 B 的 特征 和 矩阵, d3 (43), D(X4) 及 esG) 分 别 表示 特征 矩 
阵 SG) 的 不 变 因 子 .行列 式 因 子 和 初等 因子 , 即 4 的 不 变 因子 ,行列 式 因 子 和 初等 因子 ， 
dr)、DTGOA) 及 eT(4) 分 别 表示 和 矩阵 吾 的 不 变 因子 .行列 式 因 子 和 初等 因子 ,条 件 
r(SGO)) 二 r(T()) 一 7 是 显然 的 . 

设 凡 为 矩阵 4 的 Jordan 标准 型 . 根据 定理 6. 4. 16 可 知 , Ja 的 所 有 初等 因子 是 由 其 
全 部 Jordan 块 的 初等 因子 组 成 的 . 前 面 又 已 指出 每 个 Jordan 块 与 一 个 初等 因子 一 一 对 
应 ,因此 一 旦 确定 J 的 全 部 初等 因子 ,就 能 唯一 确定 Ja (不 考虑 Jordan 块 的 排列 顺序 ). 
由 于 4 一 败 ,MT 一 4 一 JG) ,根据 定理 6. 4. 19 定理 6.4. 15 及 定义 6.4.18, 问 题 就 转化 为 
通过 特征 矩阵 外 一 A 的 Smith 标准 型 来 确定 A 的 初等 因子 ,进而 确定 A 的 Jordan 标准 型 . 


SS(A) 王 MT 一 4~AT 一 已 = 了 (入 ) 
Ds(M) = D(AM) "SN))=7TIN)=n 
es(A) = ez(》) 


图 6-10 相似 矩阵 与 其 各 种 因子 之 间 的 关系 


2(A) = dT (A) 


例 6.4.9 求 矩 阵 4 的 Jordan 标准 型 Js, 其 中 A 同 例 2. 5. 1. 
解 :初等 因子 法 . 
对 特征 矩阵 虹 一 4 进行 初等 变换 , 则 (请 读者 自行 补 上 所 用 的 初等 变换 ) 


> i 0 一 于 0 == 字 0 0 
A—A=| 4 六 一 六 0 | 一 | 一 3 1 0 l= 1 0 
一 1 0 外 一 包 0 一 1 类 一 疙 0 二 过 1 一 2 
= 0 0 1 0 0 
| 0 1 0 ~ QH—D: G2 QL 
0 | 丸 一 儿 0 一 下 0 
上 . 昌 0 1 0 0 
~ 0 0 QA=DA—1Y|~I0 1 0 = J(0) 
9 二 1 0 0 0 = A=17 
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由 J 了 (2) 可 知 A0) 的 初等 因子 为 4 一 2, (4 一 1)*. 从 而 所 求 的 Jordan 标准 型 为 
2 0 0 


0 1 1 


0 0 1 


与 例 2. 5. 1 比较 可 知 ,初等 因子 法 的 优点 是 不 必 求 出 Jordan 变换 矩阵 P. 当然 ,在 需 
要 求 出 P 的 场合 ,显然 不 能 使 用 初等 因子 法 . 

最 后 ,我 们 再 来 解决 2. 6. 3 小 节 末 尾 的 “ 误 打 误 撞 ” 问 题 ,给 出 最 小 多 项 式 的 生成 
机 制 . 

定理 6.4. 20 矩阵 4 的 最 小 多 项 式 m(4) 是 矩阵 4 的 最 后 一 个 不 变 因 子 d, (4)，, 即 若 

opG) = | 1 一 4 王 QCA" QA)” 
则 4 的 最 小 多 项 式 为 
m(A) = A—ADL AoA) 


这 里 d; 为 4 的 Jordan 标准 型 J 中 包含 4; 的 最 大 Jordan 块 的 阶 数 , 即 特 征 值 4; 的 指标 . 

例 6.4.10 使 用 最 小 多 项 式 m.(X) 重 解 例 2. 6. 3. 

解法 三 :基于 最 小 多 项 式 的 Cayley-Hamilton 法 . 

由 例 6. 4. 9 可 知 , 4 的 最 小 多 项 式 为 m4) == d; (4) = 二 24 一 1)?*(4 一 2). 而 矩阵 多 项 
式 f(4) 对 应 的 多 项 式 为 f(4) 一 和 一 414 十 613 一 612 十 6 一 3, 由 于 fQ) = 二 QQ? 十 Dm(4) 
十 4 一 1, 所 以 


== 妨 1 0 
f(A4)= (42 十 Da(4A) 十 4 一 工 一 4 一 TI 一 | 一 4 2 0 
上 六 于 


6.5 和 矩阵 函数 及 其 计算 


和 矩阵 函数 在 力学 ,控制 理论 及 信和 号 处 理 等 学 科 中 具有 重要 应 用 . 类 比 普通 函数 ,矩阵 
函数 的 特殊 之 处 在 于 其 自 变量 与 因 变 量 都 是 方 阵 . 对 应 于 和 抢 阵 函数 的 多 种 表示 方式 ( 圭 
级 数 表示 、Jordan 标准 型 表示 、 多 项 式 表示 、 积 分 表示 等 ) ,定义 矩阵 函数 的 方式 也 很 多 . 


6.5.1 矩阵 函数 的 定义 及 性 质 


在 第 2 章 , 借 助 于 Jordan 分 解 ,我 们 将 4” 的 计算 转化 为 J" 的 计算 ,即将 矩阵 函数 
f(4) = 二 4" 的 计算 转化 为 矩阵 函数 FJD) 二 了 的 计算 . 这 个 想法 可 以 极 大 地 推广 到 更 多 
的 矩阵 函数 . 

引 理 6. 5.1 设 一 元 复 变 量 函数 f(z) 可 展开 为 收敛 半径 为 R 的 窜 级 数 , 即 


Fila) = Zot [el 
k=0 
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将 ， 阶 Jordan 块 厂 OD 简 记 为 了 若 谱 半 径 p(J) < R, 则 箱 阵 竺 级 数 > cuJ* 收敛 ,其 和 为 


1 y Re ee G1) 
站 1 7 mt (A) 
. f2) : 
Dae = (6. 5. 1) 
k=0 由 就 
7 (CA) 
fC2) 


证 明 : 令 5S, = >)cJ*, S,(4) 二 >) ch 由 式 (2. 6.6) 可 知 
k=0 k=0 


ce Dj adcl A A A 
k=0 k=0 k=0 
So 
k=0 
AS， 一 
cuC1 > 
k=0 
Da 沾 
k=0 
/ 1 (x—1) 
SG) SO) mis 0 
四 S,, (A) 
S',, (A) 
Sr (4) 


其 中 , / 二 时 规定 Ct = 0. 


因为 函数 $,(z) 二 2 cx tt 的 收 全 半径 为 R, 且 |4| 二 R, 因此 SC) ,S44),…， 
k=0 
Sw (4) 都 收敛 ,是 SO) 二 FS GD 一 户 O Se = 二 Po) 从 而 


f0) 二 Fw) st 


(nO— >! 
~ fC) 
Dc 一 lim S,, 
k=0 mo 让 
11/ (A) 
FA) 


证 毕 . 
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定义 6.5. 1 称 式 (6.5.1) 为 Jordan 块 J 的 矩阵 函数 (matrix function), 记 为 


f(D)，, 即 


f(D = Do 
k=0 


定理 6. 5. 2 (Lagrange-Sylvester 定理 ) 设 f(z) 二 》) cz*, 且 f(z) 的 收敛 半径 为 
k=0 
R. 设 方 阵 4 的 Jordan 分解 为 4 二 PJP7', 这 里 J 二 diag(Jhi,Js，…,J,). 若 谱 半 径 2(A) 


一 RR, 则 矩阵 宕 级 数 > cuA* 收敛 ,其 和 为 


oo 


DoA* 一 Pdiag(CFCh) ,FF D))。P 


k=0 
其 中 
Fey LOY we fy 
A i : 
FU) 
了 
7 Ci) 
Pon 


Do 


3 = 瑟 全 二 下 于 二。 
ET k=0 k=0 


=Pldiag( Da, Das, Dl oT:) ]P 
4=0 k=0 


k=0 


= P. diag(f (hh),f 2) ,f(T)) .PP 
证 毕 . 


定义 6. 5.2 称 式 (6. 5.2) 为 方 阵 4 的 矩阵 函数 , 记 为 f(4), 即 f(4) = 


在 微 积分 和 复 变 函数 中 ,已 经 证 明 下 列 寡 级 数 展开 式 : 


ee 二 Si ,R= 二 wo 
k= 。 


TV 《一 1)/ 
sinz 一 和 2 CRF R 一 十 oo 


(1—2) = Sa, R=1 
k= 二 


mt 十 二 = YW CD nn, R=1 


《6. 5. 2) 


(85 3 


oO 


了 


k=0 
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相应 地 ,对 任意 A € C”, 按照 Lagrange-Sylvester 定理 ,我 们 有 如 下 矩阵 函数 : 


如 三 和 a 
C= | 
Sn 2 FEDS 
= 二 (=17 2k 
coOSA 一 之 ， CK) I A 


(一 人) 一 >) A*, po(A4) 一 1 


k=0 
lat a= Wi A a oy a 
k=0 k 二 人 
以 及 含 参 矩 阵 函 数 ( 定 义 见 6. 6. 1 小 节 ): 
At - If 3 
ee 二 A 
名 局 
Rs 六 全 入 2k+1 A2k+l 
sin(Ar7) 之 728 二 Ti A 
S 《人 一] 六 2k A 2k 
cos(A1) 和 2 Ck) I iA 


其 中 , e , sin 和 ,cosh 分 别 被 称 为 方 阵 4 的 矩阵 指数 函数 .和 矩阵 正弦 函数 和 矩阵 余弦 函数 . 
根据 欧 拉 公式 e” 二 cos9 十 jsin9, 这 里 7 = 二 v 一 1 , 还 可 以 推出 : 
e4 一 cosA 十 jsinA 


cosA= Ce’ 二 +@) 
sinA = 1 (ena —@i4) 
2] 


cos(—A)= cosA 
sin(— A)=— sinA 


我 们 给 出 欧 拉 公式 的 证 明 如 下 : 
e* = 


jt a | 
人 A: 一 J 2k | 了 2k+1 
名 大 六 ar + 2 F144 
(一 1) 人 过 一 T 逃 2H Se 
= 也 (2k)! he i 一 cosA 十 JsinA 


定理 6.5.3 设 AE€ C” 的 Jordan 分 解 为 4 一 PJP-, 则 

(1) e 一 PerP 1; (2) dete4: = e‘™Y. 

1 下 昌 日 。 a ST i SE — DaltpD— 
证 明 : (1) e > 二 Pt 一 到 这 六 tds = PenP-， 
(2) dete4' = detP ». dete’ 。det P"! 
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er X + XxX 


: ， ， 
= detet = 用 二 [[e = eZ 一 et) 


i=1 


Eant 
我 们 看 到 微 积 分 中 的 一 些 性 质 被 平行 地 推广 到 和 矩阵 函数 . 但 令 人 遗憾 的 是 ,指数 运 
算 规则 ee = Be 三 ?一般 不 成 立 . 


例如 , 当 4 一 (。 
因此 


j= | | 时 ,显然 42 = 4,B? = B,(A 十 B): 一 4 十 了 B， 


要 er i 
i 


三 了 十 (人 e 一 1 和 三 多 2 


e l—e 
着 一 T 十 Ke DB= ( ) 
0 1 


et3 一 了 十 (4 十 B) 十 去 2(A 十 B) 十 … 十 直 2(A 十 B) 十 … 


ez | 
0 1 
验算 可 知 ees ,eses ,ea 确实 两 两 不 等 . 
我 们 自然 会 进一步 追问 ,什么 条 件 下 指数 运算 规则 成 立 呢 ? 
定理 6.5.4 设 4B = 二 BA, 则 
(DD ee = = ey (WD ee SS Be = 


证 明 : 只 证 结论 (1). 
1 
ee = (1 十 4 十 亲征 dU 


一 了 3 DAB) = 


I+(4+B) 二 (A 二 AB 十 BA+B') 十 … = es 


另外 ,注意 到 e*” 一 es 一 et, 因此 结论 成 立 . 证 毕 . 

当 A 可 道 时 ,显然 ee* 二 ee 二 了 , 即 (@)71==@%. 类似 地 , (e*)-!= 二 4. 另外 ， 
当 A 一 B 时 ,显然 有 (e)? 二 eX. 一 般 地 ,对 任意 &E ZZ, 可知 (e)* 二 e4 (上 为 负数 时 
假定 A 可 道 ). 类 似 地 (e*)* 二 e%*”% (为 负数 时 假定 4 可 逆 ). 

定理 6.5.5 如 果 4B 二 BA, 证 明 : 

(1) cos(A++B)= cosAcosB— sinAsinB; (2) sin(4 十 再 ) = sinAcosB + cosAsinB. 

证 明 : 只 证 结论 (1). 结论 (2) 留 作 练习 . 

cosAcosB— sinAsinB 

一 这 (et 十 em) 二 (e 十 ea) = 过 ti = sp — en) 


a [Lew 十 € 1(4+8) 十 ei 8) 十 @ 7 ] + 二 [er 本 @ 14+8) i 4B) = | 
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一 于 (ee 十 er) = cos(A +B) 


证 毕 
特别 地 ,由 定理 6. 5.5 可 知 cos(24) 一 cos24 一 sin24， sin(24) = 2sinAcosA. 


6.5.2 和 矩阵 函数 的 计算 


前 面 我 们 结合 矩阵 函数 的 定义 和 已 有 关系 式 ,解决 了 一 些 矩 阵 函 数 关 系 式 的 证 明 . 
按照 定义 , 抢 阵 函数 的 计算 被 归结 为 矩阵 过 级 数 求 和 ,其 中 占据 核心 地 位 的 是 矩阵 高 次 
宕 的 计算 . 如 果 各 次 方 寡 之 间 存 在 特殊 的 关系 ,显然 计算 就 能 得 到 极 大 的 简化 . 这 就 是 递 
推 公式 法 的 想法 . 

一 、 递 推 公式 法 

计算 原理 ”通过 和 矩阵 A 的 特征 多 项 式 或 最 小 多 项 式 , 或 者 通过 其 他 途径 ,得 到 矩阵 
方 寡 之 间 的 递 推 关 系 式 , 代 入 相应 的 矩阵 寡 级 数 ,从 而 将 矩阵 函数 的 计算 转化 为 数 项 级 
数 求 和 问题 . 

例 6.5.1 设 y 为 R" 中 的 单位 向 量 , 令 B 二 I 一 yy', 求 e 

解 :注意 到 y'y 二 1, 显然 可 知 


B=(—y) =I—2y yy =I—2y +(y yy =I—yy'=B, 
所 以 BP" 二 B (n 宇 2), 从 而 
Si 可 
Ey 1+ cal I+B2O =1+(e DB 


例 6.5.2 设 4 阶 矩阵 4 的 特征 值 为 x, 一 x,0,0, 求 sin4. 
解 :由 题 可 知 , 4 的 特征 多 项 式 为 
gO =A—DA+FRD 一 入 一 T22 
因此 由 Cayley-Hamilton 定理 可 知 
O= 9p(A) 一 44 一 mh4? 


因此 
A'=rA ,A =rA ,A =rA =r nA =nA ,A = AA= nA ,. 
一 般 地 
A =n A A*l =n A (k=2,3,.) 
从 而 
sinA= > 0 > ET 
i=0 1 


《一 了 入 
一 加 二 = 3 i Akt! 


a A =A—mm Ai 
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递 推 公式 法 只 适用 于 矩阵 4 的 递 推 关系 式 不 太 复杂 的 情形 . 例如 ,对 下 面 例 6. 5. 3 
中 的 矩阵 A, 尽管 矩阵 只 有 2 阶 ,只 存在 2 项 递 推 关 系 式 A*"' 二 24* 一 A”' ,但 在 求 e* 这 
样 的 矩阵 函数 时 , 仍 会 涉及 大 量 复杂 的 级 数 运算 . 

对 更 一 般 的 矩阵 4, 我 们 只 能 回归 到 和 矩阵 函数 的 定义 , 即 借 助 于 Jordan 分 解 或 特征 
值 分 解 来 计算 矩阵 函数 . 当然 这 种 方法 的 计算 也 不 简单 . 

二 、Jordan 分 解法 

计算 原理 ”函数 f(z) 可 展开 为 收敛 半径 为 R 的 究 级 数 . 如 果 和 矩阵 4 的 谱 半 径 p(4) 
二 R, 则 可 按 式 (6. 5. 2) 来 计算 和 矩阵 函数 f(A4). 


2 三 1 
例 6.5.3 已 知 丐 阵 4 一 人) ，, 求 矩 阵 函 数 ee 和 ee、 


解 :可 求 得 和 的 Jordan 分 解 为 4 一 PJP- ,其 中 了 一 (。 = 了 


当 f(z) 二 =e@ 时 , f(1) 一 e 太 (1) 一 e， 则 


e ee 2e 一 e 
坚 王 卫 六 + 二 
€, e 0 
当 f(z) = ez 时 (注意 这 里 把 t 看 成 常数 ), f(1) = eT ,了 (1) = 二 ter, 则 
Ge el Wi —tel 
e4: 一 卫 1 = 
久 攻 te (1—#)er 


例 6.5.4 求 和 矩阵 函数 sin4 和 sin(A7), 其 中 的 矩阵 4 与 例 2. 5. 1 相同 . 
解 : 例 2. 5. 1 中 已 求 得 4 的 Jordan 分 解 为 4 = PJP71, 其 中 
2 小 0 0 1 0 


od ¢o i 1 一 1 一 1 
当 f(z) = sin(z) 时 f(1) = sinl,f (1) = cosl, 则 


sin2 0 0 sinl 一 2cosl cosl 0 
sinA=P| 0 sinl cosl|P = 一 4cosl sinl 十 2cosl 0 
0 0 sinl sin] 十 2cosl 一 sin2 sinl 一 cos1 十 Sin2 sin2 


当 f(z) = sin(xt) 时 (注意 1 是 常数 ), f(1) = sint, 了 (1) = tcost, 则 


sin2: 0 0 sint — 2tcost tcost 0 
sin(A1)==P| 0 sint tcost|P 1! = — 4tcost sint 十 2tcost 0 
0 0 sint ‘sint 二 2tcost— sin2t — sint—tcost sin2t sin2t 


例 6.5.5 证明: 设 A4 的 所 有 特征 值 的 实 部 均 小 于 零 , 则 lime* = 0. 
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证 明 : 设 A 的 Jordan 分 解 为 4 三 PJP7, 其 中 = diag(i,J2,…,J,), 则 


4 | PierPp 三 = P !'diag(el’, el, ,el')P 


| = 上 
eit te 一 二 一 六 ei 
(1; — ! 
其 中 ， efi = es 及 : (z cya ] ,25°%,5) 
5 teit 
Ga 


设 开 一 竣 上 7 7 一 V 业 ， 由 题 知 a; 二 0, i 二 1,2,*…,s， 因此 


lime*’ = lim (e*)!i(cosbit jsinbt) 一 0 
tt ti->t% 


故 lime* 二 0, 从 而 lime” 二 0, 这 样 就 有 lime 二 lim P eP 一 O 证 毕 . 

当 抢 阵 人 可 对 角 化 时 ,Jordan 分 解法 就 特殊 化 为 下 面 的 特征 值 分 解法 . 

三 、 特 征 值 分 解法 

计算 原理 ”函数 f(z) 可 展开 为 收敛 半径 为 RR 的 短 级 数 . 设 可 对 角 化 矩阵 4 的 特征 
值 分 解 为 4 一 BAP ,这 里 A 二 diag(41,Xs，,…,X,), 如 果 矩 阵 4 的 谱 半 径 o(4) 二 R, 则 
由 式 (6. 5. 2) 可 知 


f(A4)=P.f(4).P =P. diagl fi),,f0,)] .PT! 


4 6 0 
例 6.5.6 求 矩 阵 函 数 扩 和 cos4, 其 中 4= | 一 3 一 5 0|. 
= 人 


解 :矩阵 4 的 特征 值 为 1, = 一 2 = 一) 一 1. 
1 二 一 2 对 应 的 特征 向 量 为 qi = (一 1,1,1)7; hs 二 二 1 对 应 的 特征 向 量 为 as 一 


一 上 一 总 有 
[2251700 7 ws 二 (0y0.13T, 因此 相似 矩阵 P= (aya,a) 一 | 1 1 0|. 从 而 

1 0 71 

e 2 2e 一 e2 2e 一 2s2 0 

时 一 卫 ef Pl= |e*—e 2e*—e 0 

ef EeE*—e 2e*—2e et 

&OS(— 22 
cos4 一 卫 cosl Pp 


cosl 
2cosl 一 cos2 2cosl 一 2cos2 0 
一 | cos2 一 cosl 2cos2 一 cosl 0 


COS2—cosl 2cos2 一 2cosl cosl 
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例 6.5.7 用 特征 值 分 解法 重 解 例 6. 5. 1. 

解 :因为 BT = B, 即 B 是 实 对 称 和 矩阵, 可 以 正 交 对 角 化 . 

由 于 y 为 R" 的 单位 列 向 量 , 所 以 r(yy7T) == 1, 这 说 明和 矩阵 yy' 的 非 零 特征 值 只 有 一 
个 .又 因为 (yyT)y = 二 yyry) 二 1.y, 所 以 1 是 矩阵 yy 的 唯一 非 零 特征 值 ,从 而 可 求 得 
和 矩阵 B 二 了 一 yy" 的 特征 值 为 0,1,…,1. 

显然 , y 是 B 的 特征 值 0 所 对 应 的 特征 向 量 ; 任 取 x EW, 其 中 W = span (y)-, 显 
然 y | z, 因此 Bz = (I 一 yy')z 二 xz 一 (y'z)z 二 zz 一 0.:z 二 1，zx, 即 xz 是 B 的 特征 值 1 
所 对 应 的 特征 向 量 . 由 于 dimW 二 nn 一 1 且 B 是 实 对 称 矩 阵 , 故 可 取 到 W 的 一 组 标准 正 交 
基 y2,y3 ,yy,. 

令 了 一 (y,yo，…,y1)， 显然 Y 是 正 交 矩阵, 并且 B 二 YDY” 二 YDY', 此 即 


0 2» 
1 y2 _ 
B= (yyy ,yy) = yy;! 十 办 ys 十 十 yynT 
1) ly; 
从 而 
el y 
el y2 
eo= (yy2 syn) . .| = 好 十 ee Ty 二 "二 yayn ) 
ely 


= (GT 一 B) 十 eB 一 TI 十 (e 一 1)B 


利用 矩阵 震级 数 求 矩 阵 函 数 , 要 保证 相应 的 一 元 函数 f(z) 必须 能 够 展开 成 收敛 的 
窜 级 数 ,这 个 条 件 一 般 不 容易 满足 . 而 根据 Jordan 分 解法 和 特征 值 分 解法 ,我 们 只 涉及 
f(z) 在 特征 值 处 的 函数 值 即 各 阶 导 数值 , 即 用 和 矩阵 的 谱 集 cC4) 就 能 表示 和 矩阵 函数 
f(4). 这 种 “只 吃 着 碗 里 的 ,不 盯 着 锅 里 的 ”的 新 思路 ,拓宽 了 和 矩阵 函数 的 定义 范围 ,尤其 
是 对 那些 不 能 展开 成 收敛 的 寡 级 数 的 函数 f(z), 也 可 以 定义 出 相应 的 矩阵 函数 f(A4). 
定义 6. 5.3 ”如果 和 矩阵 4 的 最 小 多 项 式 为 


说 人) = MA AA) 
则 对 于 任意 一 元 复 值 函数 f(X) (我 们 特意 换 成 了 变量 ) ,只 要 
fs A) DAY C= 1 9s) 


有 意义 ,我 们 就 说 函数 ja) 在 4 的 谱 e(C4) 上 有 定义 ,并 称 这 些 值 为 函数 f(4) 在 A 的 谱 
ol(4) 上 的 谱 值 . 

定义 6.5.4 ” 设 一 元 复 值 函 数 f() 在 矩阵 4 的 谱 o(4) 上 有 定义 , 且 和 矩阵 A 有 
Jordan 分 解 A = 二 PJP7', 这 里 了 三 diag( 刀 ,J:，…,J;), 则 和 矩阵 函数 FA) 定义 为 
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f(A) 一 了 。 diag[L fT1), fT2),***, fC.) |] . Pp! 


其 中 , f(J;) 与 式 (6. 5. 3) 相同 . 

可 以 证 明和 矩阵 4 的 最 小 多 项 式 m (2) 在 谱 cC4) 上 的 谱 值 全 为 零 . 另外 ,对 两 个 在 谱 
ol(A) 上 的 谱 值 对 应 相等 的 一 元 多 项 式 ,它们 的 和 矩阵 函数 也 相等 . 这 就 是 说 ,对 给 定 的 矩阵 
4 而 言 ,任意 矩阵 多 项 式 pC(4) 仅 由 p (4) 在 ol(4) 上 的 谱 值 确定 . 

例 6.5.8 求 矩 阵 函数 In4 和 VA，, 其 中 矩阵 A 与 例 2. 5. 1 相同 . 

解 : 例 2. 5. 1 中 已 求 得 A 的 Jordan 分 解 为 4 = 二 PJP "1 ,其 中 

2 0 0 0 1 0 
J=|0 1 1l,P=|I0 2 1 


0 0 1 1 =1 :=1 
显然 , Fa) 二 IM 和 gQ) 二 V4 在 4 二 1 和 4 二 2 都 有 意义 ,而 且 4 = 二 1 时 了 0)=1， 
g'(1) 一 方 , 即 f(2) 和 g() 在 谱 集 o(4) = {1,2) 上 有 定义 ,因此 矩阵 函数 ln4 和 VA 都 
有 意义 , 且 


ln2 0 0 一 区 1 0 
ln4 一 P.lnJ .P=Pl0o0 0 1P'=| 一 4 2 0 
0 0 0 一 ln2 十 2 ln2 一 1 ln2 
1 
人 0 0 
=-P.V.PI=-Plo 1 去 |P"' 一 —2 2 0 
2 一 3 SV v3 


在 定义 6. 5.4 中 ,矩阵 函数 f(A) 只 与 函数 f(4) 在 o(4) 上 的 值 有 关 , 这 启发 我 们 ， 
如 果 能 够 求 出 一 个 尽 可 能 简单 的 函数 p(X) (比如 复 系数 多 项 式 ) ,使 得 两 者 在 c(4) 上 都 
有 定义 ,并 且 对 应 的 值 都 相等 ,那么 便 应 当 有 f(4) = p(4). 这 种 通过 “狸猫 换 太 子 ” 来 以 
简 代 繁 的 方法 ,就 是 著名 的 Hermite 多 项 式 插值 问题 . 

定义 6.5.5 设 一 元 复 值 函 数 f(4) 在 矩阵 4 的 谱 c(C4) 上 有 定义 ,日 A 有 最 小 多 
项 式 

m(A) = ACAD™ ee AOA 

如 果 存 在 复 值 多 项 式 函 数 p(4)，, 使 得 f0) 与 p04) 在 谱 o(4) 上 有 对 应 相等 的 谱 值 , 则 条 
阵 函 数 (4) 可 定义 为 1(4) = p(4). 

可 以 证 明 对 fQ) 在 矩阵 4 的 谱 cC4) 上 的 那些 谱 值 ,多 项 式 函 数 p(X) 存在 但 不 唯一 . 

至 此 ,我们 可 给 出 待定 系数 法 的 计算 原理 , 即 确定 p(X) 的 各 项 系数 的 原理 和 方法 . 
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计算 原理 ” 设 和 矩阵 4 的 特征 多 项 式 为 
2G) 一 | 一 4 一 (一 和) 和 AA)™ 
由 带 余 除法 , 设 有 Fa) = QQ)gG) 十 CQ)， 则 可 由 
(1 Ss 1,2,.,5) 


FS= FO SN SS 
确定 出 余 式 r(4). 再 根据 Cayley-Hamilton 定理 ,有 p(4) 二 0, 从 而 f(4) = r(4). 
例 6.5.9 求 矩 阵 函 数 @, 其 中 矩阵 和 4 与 例 2. 5. 1 相同. 


解 :矩阵 A 的 特征 多 项 式 为 g(2) 二 0 一 1)70 一 2). 设 FA) = 总 , 且 
f00) = pg +r) = oA eA T+at+A 


则 
FG) 一 ee 一 4 十 5 十 c 一 r(1) 
f(2) 一 蝶 一 十 20 十 4c 一 7r(2) 
f(1)=e=6b+2c=r() 


解 得 a 二 c= 二 @ 一 2e = 二 ,b= 一 2e 十 5e. 因此 
一 e 


e 0 
f(A)=@ =r(h)=ali+W 二 A’ = 一 4e 3e 0 
一 时 十 3e e:—2e ee 


1 0 
一 |0 0 1|, 求 含 参 矩阵 指数 函数 ea. 


及 高 四 


解 :矩阵 Ci 的 特征 多 项 式 为 p(X) = 入 一 3 一 2 天 (十 1)20 一 2), 因 此 CI 的 特征 
值 为 1 三 2, 一 1. 对 重 特征 值 4 二 一 1, 由 于 ”一 r(C 十 D == 3 一 2 = 1, 因此 X= 一 1 只 
多 0 0 

有 1 个 特征 向 量 , 即 矩阵 C' 的 Jordan 标准 型 为 J 王 |0 一 1 1 
@ ff =1 


SO 


例 6.5.10 已 知 可 控 标 准 型 C, 


. 设 f(4) = 二 (注意 


把 :看 成 常数 ), 且 
JAD) = pg +r = pW eH) 十 十 以 十 ca 


注意 到 (4) = ze rG) 二 5 十 2c4，, 则 
f(2)= ee =at+22+4c = r(2) 
f(—l)=e'=a—bi+ec=r(—1) 

2c 一 二 (一 1) 


RE 
解 得 a 一 二 [e' 十 (8 十 6De"],b 一 [2 + (3:—2)e "Je = 唐 [e* 一 0 十 3De"], 从 而 
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旦 十 (8 十 6 的 6 2 的 一 (2 一 3064 e'—(l+3Der 


er 一 aT 十 CI 十 cCl = 二 2 近 一 (2 十 60e: de:+(5—3De’: 2e'—(2—3De! 


de 一 (4 一 60e 7 86 一 (8 一 3064 de 二 (5—3De’ 

Matlab 中 提供 了 内 置 函数 expm、logm 和 sqrtm 可 分 别 计算 矩阵 指数 函数 矩阵 对 
数 函 数 InA 和 和 矩阵 开 方 函数 VA. 但 是 在 Matlab 中 没有 提供 专门 的 内 置 函 数 来 计算 sin4 
和 cos4. 好 在 我 们 可 以 通过 自 定义 函数 接口 

funm(A, @ sin) 

带 回 sin4. 另外 除 内 置 函数 expm 外 ,logm、sqrtm 和 自 定义 函数 接口 funm 都 不 支持 符 
号 计算 . 
6. 5.3 矩阵 指数 函数 的 数值 计算 :Krylov 子 空间 法 

熟悉 现代 控制 理论 的 读者 都 知道 矩阵 指数 函数 e* 的 重要 性 . 对 于 它 的 数值 计算 问 


oo 


题 , 显 然 可 利用 矩阵 级 数 e 二 > ) 省 来 计算 它 ,此 即 Matlab 内 置 函数 expmdemo2( 原 名 


expm2) 的 实现 原理 ,其 代码 如 下 : 


function E= expmdemo2 (A) 


E= zeros(size(A));F = eye(size(A));k= 1; 
while norm(E+ F- E,1) > 0 


E= E+ F; 
F= A* F/k; 
k= k+ 1; 
end 


遗憾 的 是 ,这 个 算法 只 适用 于 教学 目的 , 磁 到 实际 问题 根本 不 可 行 . 这 是 因为 随 着 矩 
阵 4 的 阶 数 和 范 数 14| 的 增 大 ,计算 结果 的 准确 性 越 来 越 差 , 计 算 时 间 也 越 来 越 慢 . 究 其 
原因 ,是 因为 即使 A 是 稀 朴 的 , es 一 般 也 是 稠密 的 . 

根据 上 一 节 的 分 析 , 我 们 也 可 以 借助 于 矩阵 A 的 谱 分解 4 = VAYVYS 来 计算 失 , 此 即 
Matlab 内 置 函数 expmdemo3( 原 名 expm3) 的 实现 原理 ,其 代码 如 下 : 


function E= expmdemo3 (A) 
[V,D] = eig(A); E= V* diag(exp(diag(D))) /V; 


但 这 种 算法 只 对 对 称 矩 阵 和 正 交 和 矩阵 等 正规 矩阵 有 效 . 当 A 是 亏损 矩阵 时 ,此 算法 
完全 无 效 . 因此 这 个 算法 也 仅 适 用 于 教学 . 

这 样 看 来 ,如 何 有 效 又 快速 地 计算 。, 就 显得 尤为 重要 . 事实 上 ,expm 是 1984 年 
Matlab 最 早 提供 的 80 个 内 置 函 数 之 一 ,其 理论 基础 则 来 自 Moler 和 Van Loan 在 1978 
年 发 表 的 著名 的 综述 性 论文 . 在 该 文中 ,他 们 共 列 举 了 19 种 算法 ,其 中 基于 Pade 通 近 的 
折 半 加 倍 法 是 使 用 最 广泛 的 一 种 算法 ,expm 就 是 根据 这 一 方法 来 实现 的 . 如 今 几 十 年 过 
去 了 ,正如 前 面 已 指出 的 那样 ,Krylov 子 空间 法 已 经 成 为 大 规模 计算 的 首选 方法 . 

事实 上 , e 的 计算 量 是 Ol), 当 n 较 大 时 ,这 也 是 “几乎 不 可 能 完成 的 任务 ”. 当然 
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绝 大 部 分 应 用 中 ,我 们 需要 计算 的 不 是 矩阵 , 而 是 矩阵 向 量 积 ety, 这 里 vy 是 已 知 向 量 . 
因此 用 Krylov 子 空间 法 解决 这 一 问题 的 思路 ,就 是 通过 一 个 适当 规模 的 “小 型 问题 ?来 
近似 计算 大 规模 问题 esy. 比如 对 非 对 称 和 矩阵 4, 以 ”为 初始 向 量 , 借 助 于 Arnoldi 过 程 ， 
我 们 可 得 到 4 的 Hessenberg 分 解 ViAV 二 Hi , 这 样 就 有 e*v 之 VielViv 一 Wegel, 其 
中 el 为 & 阶 单位 矩阵 的 第 一 列 . 

可 以 证 明 , 上 述 Arnoldi 方法 满足 下 列 误差 界 . 

定理 6. 5.6 设 A 的 值 域 (range) xa4x 包含 在 圆 盘 内 , 即 

{xAx|xE€E C",l|xl;=1}C{z€E Clzt+pol<p} 

则 


|etv— Ve el, < 12e7 人 ，710 之 20 


对 于 任意 矩阵 A, 可 通过 平移 , 即 取 we R 使 得 A = A 十 el 的 值 域 xa4x 位 于 左 半 
闭 平面 |x 十 p| 志 6 内 . 从 上 述 算法 易 知 此 时 VV = Vi, 本 = Hi 十 al, 从 而 有 


| er vp—Viee |,=e™ | esv—V,ede |s<12e “ete> ( 半 ) ， 7 之 20 


6.6 和 矩阵 的 微分 与 积分 


实际 使 用 时 ,和 矩阵 函数 与 函数 矩阵 的 微分 和 积分 常常 同时 出 现 . 研究 矩阵 函数 和 函 
数 和 矩阵 的 微分 和 积分 ,这 对 研究 微分 方程 组 以 及 优化 问题 等 都 非常 重要 . 有 的 学 者 列 出 
了 矩阵 分 析 的 五 大 分 析 方 法 (梯度 分 析 、 奇 异 值 分 析 、 特 征 分 析 、 子 空间 分 析 和 投影 分 
析 ) ,其 中 位 于 第 一 的 就 是 梯度 分 析 方 法 . 


6.6.1 含 参 矩阵 函数 的 微分 与 积 


定义 6. 6. 1 设 有 矩阵 函数 /CA), 其 中 4 为 常数 矩阵 , 则 /CAz) 是 关于 参数 ; 的 函 
数 逢 阵 ,简称 含 参 和 矩阵 酉 数 ,其 导数 (如 果 存 在 的 话 ) 记 为 2 中， 其 积分 可 参照 函数 算 


阵 的 积分 . 
例 6.6.1 设 和 矩阵 A 为 任意 常量 方 阵 , 则 
(C17 er = Me 
dr 


(2) cosAt 一 = 六 En 


(3) 全 sin47 nN 


例 6.6.2 已 知 含 参 矩阵 函数 


sin2t 二 3sint 5sin2t— sint 
f(At1) = sin(A1) = 
3sin2t— sint 5sin2t + sint 
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(1) 求 矩阵 4 ; (2) 求 | faDar 
解 :(1) 两 边 对 上 求 导 ,得 


2cos2t 十 3cost 10cos2t 一 cost 
Acos(A1) = 


6cos2t— cost lO0cos2t+ cost 
Ny 5 9 
注意 到 当 t 二 0 时 , cos(At) = cosD 二 了 因此 A 二 hcosO 一 人 
(2) 各 元 素 分 别 对 上 求 定 积分 ,得 
b b 
| (sin2t + 3sint) dt | (5sin2t — sint) dr 
b a a 
| raod= 
a b b 
| (asi — cin | Caindl sin 


(cosa 一 cosbp)(cosa 十 cosp 十 3) (cosa— cosb)(5cosa+ 5cosb— 1) 


(cosa 一 cosb)(3cosa 十 3cos 一 1) (〈cosa 一 cosbp)(5cosa 十 5cosp 十 1) 


6.6.2 函数 对 向 量 的 微分 


为 避免 繁 匈 ,本 节 后 面 一 律 只 讨论 实数 域 上 的 情形 .当然 通过 稍 加 修改 ,读者 不 难 将 
相关 结论 推广 至 复数 域 . 

众所周知 ,多 元 实 函 数 f(zi ,zz，… ,zx,) 是 一 元 实 函 数 f(z) 的 推广 ,即将 RR 到 RR 的 
映射 推广 为 RX Rx…xR 到 R 的 映射 .车 记 x 二 (zi ;zz,…,z,) 1 则 了 也 被 视 为 RR” 
到 R 的 映射 , 即 f(x) = f(zi ,zz，… ,Zz,). 类 似 地 ,多 元 函数 的 梯度 也 可 视 为 一 元 函数 的 
导数 的 推广 , 即 自 变量 为 向 量 x 的 导数 . 

定义 6.6.2 设 有 多 元 实 函 数 f(x) 二 f(zi,zx2，,…,X,) ,x EE 民 ”. 称 列 向 量 


Of (x) afx) . of))T 
( i ) C6 6 1 


为 函数 f(x) 对 向 量 x 的 微分 或 梯度 , 记 为 “有 2 或 YACo， 也 记 为 grad7co 或 Vf 


显然 ,梯度 的 各 分 量 给 出 了 标量 函数 在 该 分 量 上 的 变化 率 , 从 而 梯度 就 给 出 了 当 自 
变量 x 增 大 时 函数 f(x) 的 最 大 增长 率 ;相反 ,梯度 的 负 值 也 就 是 负 梯 度 则 指出 了 当 自 变 
量 x 增 大 时 函数 f(x) 的 最 大 减少 率 . 

例 6.6.3 设 实 方 阵 A 与 y € R" 均 与 向 量 x € R" 无 关 , 则 对 


f(x) 一 JThx = >) Payry; 


这 1 j=!1 


Vf(x)=A'y C6a 6 2) 
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特别 地 , 若 aE RR" 是 与 x 无 关 的 列 向 量 , 则 
Va(OTI 到 一 下 一双 CT 网 《6.6. 3) 


证 明 : 由 于 六 Daszjy: 一 3 Dj ayzrjy’; 一 >)(>)ajyizi， 记 4 王 (aiyoz，…， 
i=1 j=1 j=1 i=1 j=1 i=l 
Cu )， 因此 


2A 一 Daiyi = ayayrsray y= oy (j=1,2,.,n) 
i=1 


Oz; 
从 而 
Cl y ol 
0 
Vf tx) 三 一 y=A'y 
oy Or 


特别 地 , 当 A = 工时 ,注意 到 ax = 二 xia, 即 有 VCarx) 二 a 二 V,(xTa). 证 毕 . 
例 6.6.4 ”对 实 二 次 型 f(x) = xTAx = 》， 》 laxirx), 有 
i=1 j=1 


Vif (x) 一 (4 十 ATDx (6. 6. 4) 
特别 地 , 当 A 对 称 时 ,有 
Vif (x) = V(x Ax) = 2Ax (6. 6. 5) 


例 6.6.5 ” 当 有 和 4 为 实 对 称 和 矩阵 时 ,对 实 二 次 泛 函 f(x) = 3 让 A 一 加 证 6, 有 


Vf (x) = Ax—b 


因此 ,求实 二 次 泛 函 f(x) 的 极 值 问 题 转化 为 方程 组 Ax ==45 的 求解 问题 . 这 显然 就 是 
定理 6. 3. 1 指出 的 变 分 原理 . 类 比 极 值 理论 可 知 实 二 次 泛 函 f(x) 的 稳定 点 (stationary 
point) 是 可 能 的 极 值 点 . 

注意 到 梯度 V,f (x) 与 自 变量 x 是 同 维 的 ,因此 可 类 似 地 将 梯度 推广 到 自 变量 为 行 
向 量 的 情形 . 

定义 6.6.3 设 有 多 元 函数 f(x) = /zz 和 zi),xzE RR". 称 行 向 量 


df(x) of(x) . af(x) 
( i ) (6. 6. 6) 


为 函数 f(x) 对 行 向 量 x7 的 微分 或 行 梯度 , 记 为 SD 或 Vz f(x). 


将 梯度 中 的 因 变量 f(x) 推广 到 向 量 函数 ,我 们 得 到 的 自然 是 “梯度 ”和 矩阵 , 它 的 正式 
名 称 是 Jacobi 矩阵 . 
定义 6.6.4 设 有 1(x) ,f(x),…,f,(x) 都 是 多 元 函数 , 则 称 Jacobi 矩阵 
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ofi(x) dfs(x) Ofn xX) 
OX1 OX OX 
ofi(x) df lx) Sm EY 
es 9z2 9z 061 6. 7 
Of1(x) DPCxz) 人 Ca 
Ox, Ox Oz, nxXm 


为 行 向 量 函数 F(x) 一 
分 , 记 为 至 名 或 Y.PCo)， 


Cfi(x), fs (xXx), 


特别 地 , 当 m 二 nn 时, 称 行列 式 


Ofi(x) dfs (x) Slay 
Oxi OX1 QZ 
afi(x) dfslx) df x) 
OXx» OX» Oxs 
Ofi(x) dfs (x) Ofn (x 
De A x 
为 Jacobi 行列 式 , 记 为 S 2 eh 
2 3 hn 
dF(x) _ es dfz(x} da 
显然 dx =| dx ”dr ， ’ dx 


量 x 的 梯度 (仍然 是 列 向 量 ). 同 时 ,注意 到 人 0 虹 == ( 


oF(x) oF . 


;fmu(x)) 对 列 向 量 x 的 微分 ,简称 行 对 列 的 微 


(6. 6. 8) 


ergs 


9 


An 


Qzz 


T dFCx) 
oj 


各 行 是 行 向 量 函数 F(x) 对 列 向 量 x 的 各 分 量 求 偏 导数 后 所 得 的 行 向 量 . 特别 地 , 当 n 维 的 列 


向 量 x 退化 为 1 维 的 自 变量 x 时 , 4 
定义 6.6.5 设 fi(x), fo (Xx) ,…… 


of (x) 
AX1 


of (x) 


of1 (x) 
Ox» 


Of2 (Xx) 


QZ 1 


Ofm (xX) 


QZ? 


of (x) 


OX1 


为 列 向 量 函 数 F(x) == (fi (x), fo (x) 


分 , 记 为 一 < on 或 Vr F(x). 


Oxs 


退化 为 行 向 量 ( 
,f(x) 都 是 多 元 函数 , 则 称 Jacobi 矩阵 


oO (x ) 
Ox 


Ofz (x) 
Tn 


Ofm x) 
Os 


di (Zz) df (zx) ee 
cl 9 dz 9 9 


mxn 


)) 


(6. 6. 9) 


,fm(x))" 对 行 向 量 x 的 微分 ,简称 列 对 行 的 微 
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显然 , 由 (2 的 每 行 是 F(x) 的 各 分 量 对 行 向 量 xr 的 行 梯度 (仍然 是 列 向 量 ). 


例 6.6.6 对 f(x) = (Cryz) 一 x, 有 VCrT) 一 工 

例 6.6.7 对 f(x) =xT4A, 有 VCxrTA) 一 

有 了 Jacobi 矩阵 的 概念 ,借助 于 例 6. 6. 6, 式 (6. 6. 2) 和 式 (6. 6. 4) 可 推广 如 下 : 

例 6.6.8 对 f(x) 二 [y(x)]"Az(x), 其 中 列 向 量 >(x) 和 >x(Cx) 是 x 的 向 量 函 数 ， 


Vf (x) = VLyCx)] TAz(x) VLz(x)]' ATy(x) (6. 6. 10) 
证 明 : 令 = yCxz),z 一 z(Cx). 注意 到 y'Az = (y,4z), 并 根据 式 (6.4. 1) ,可 知 


Orhc) 一 Oho) 一 人 ay hz) 二 (ys he) ) 


圭 (Roy A )+ (», 4-9. 


名 <) = ( 电 y cj+ (4 她:)】 am 


= (B67) + (Be)A'y 


由 于 起 科 和 让 zx7 分 别 是 [VyC9 本 和 YLzCGo0]T 的 第 i 行 ,因此 即 得 式 (6. 6. 10). 
证 毕 . 

显然 , 当 y(x) 二 zlx) = 二 x 时 ,由 于 VY;(x') 一 工 可 知 式 (6. 6. 10) 特殊 为 式 (6. 6.4); 当 
y(x) 二 a,A 二 I 且 z(x) 二 x 时 ,由 于 Vi(y') = 二 OQ 及 V(x?') = 二 了 可知 式 (6. 6. 10) 特殊 为 
式 (6. 6. 2). 

普 助 于 Jacobi 矩阵 ,可 以 证 明 , 实 函数 f(x) 对 列 向 量 x 的 梯度 运算 也 具有 如 下 运算 法 则 : 

(1) 线 性 法 则 : VCaf (x) 十 bg (x)) 二 a Vf(x)+bVig(x),ab ER; 

(2) 乘 积 法 则 : V, (fCx)gCx)) = g(x) Vf (x) + f(x) Vig (x); 

(3) 链 式 法 则 : V, (f(y(x))) = Vy[Ly(x)]'V,f(y), 其 中 ylx) 是 x 的 向 量 函 数 . 

在 微 积分 中 ,经 过 坐标 变换 x = rcosg,y 二 rsin9, 直角 wn 


有 fz,yydrdy 变 成 了 极 坐标 下 的 二 重 各 aes | drdg, 其 中 的 


二 
| ac |= 二 /也 是 Jacobi 行列 式 . 
常用 的 梯度 公式 如 表 6-2 所 示 , 其 中 的 A、b 分 别 是 与 x 无 关 的 常 矩 阵 和 常 向 量 . 


表 6-2 常用 梯度 公式 


(A++A')x 
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多 元 函数 对 向 量 的 微分 也 可 以 推广 到 二 阶 的 情形 . 
定义 6.6.6 对 多 元 函数 f(x) == fxzz zxE 民 ", 称 Hessian 和 矩阵 


fx) FFfx) © f(x) 
QZzl Qzl zleQzz Ox] SD 
ax 时 Fr) , fx) 
( of (2) x ) ) 一 |OxzOXx! QQzzeQzz Ax; OK, 
Be . . 本 
Ff A x) 
OXOX1! eznQzza OX OX 
2 
为 f(x) 对 列 向 量 * 的 二 阶 微分 , 记 为 Vf (x) 或 人 全 澡 ， 也 记 为 HC(7). 


显然 ， Hessian 矩阵 实质 上 是 梯度 的 梯度 ， 即 Ver Vr (Ey), 其 第 行 就 是 梯度 
Vxf (x) 第 7 个 分 量 的 行 梯度 . 因此 实际 计算 时 可 先 算出 梯度 V.f (x), 再 计算 VY.f (x) 对 
行 向 量 x' 的 行 梯度 . 

例 6.6.9 当 A 和 A 对称 时 ,二 次 泛 函 f(x) = 吕 x'Ax 一 bx 十 c 的 Hessian 矩阵 为 


2 op oa J (x) ed 
Vxf (x) on A 


如 果 和 矩阵 4 还 是 正定 的 ,并 且 存 在 x*，, 使 得 V.f(x*) = Ax* 一 b = 二 0, 则 由 
Vxf (x* ) 一 4 二 0 可 知 x* 是 二 次 泛 函 的 严格 局 部 极 小 点 . 这 个 结论 显然 是 微 积分 中 多 元 
函数 极 值 判别 法 的 推广 . 

6. 6.3 和 珑 阵 标量 函数 对 和 矩阵 的 微分 


实际 应 用 中 ,经 常 要 考虑 诸如 矩阵 的 迹 及 和 抢 阵 的 行列 式 等 矩阵 标量 函数 与 矩阵 元 素 
值 变化 之 间 的 关系 ,比如 扰动 分 析 中 某 个 矩阵 元 素 值 的 变化 对 矩阵 的 迹 的 影响 等 . 矩阵 
标量 函数 显然 可 理解 为 mm 元 的 函数 , 即 JJ4A) 王 Canalz，amyal yam). 因此 ,有 
必要 将 梯度 推广 到 矩阵 标量 函数 . 


定义 6.6.7 设 有 矩阵 标量 函数 /(A4), 这 里 A 二 (ay) E Rw. 如 果 a7CA) 都 存在 
(= 1,2,°% 7mm; 7 = 1,2,°,n), 则 称 梯度 矩阵 


FA) SFAY SPAY 
Aa1i Oailz Oa1n 
ar) af) . 3f(4) 
Oaz]1 Oaz2 Oa2n 
Sf(4) ar) afC4) 
Oami Oam2 Oaym mxXn 
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为 函数 f(A4) 对 和 矩阵 4 的 微分 , 记 为 dE. 

注意 :这 里 的 自 变 量 是 矩阵 4, 并 且 4 生 与 4 是 同 维 矩 阵 . 当 A 特殊 为 列 向 量 x 
时 ,梯度 矩阵 St 特殊 为 梯度 SS， 对 行 梯度 可 做 同样 理解 , 

例 6. 6. 10 对 和 矩阵 的 迹 f(A) 二 tr(4), 有 5 二 = 

例 6. 6. 11 ”对 双 线 性 型 f(A4) 二 x'Ay 一 > a i A = 


例 6.6.12 对 行列 式 f(4) = 14| ,有 CA) = DyAy, 因此 疆 (的 ) = Ai， 从 而 


这 里 , A” 表示 4 的 伴随 矩阵 . 显然 , 当 A 可逆 时 , i 生 一 14| 47). 


例 6. 6. 13 ”对 和 矩阵 乘积 的 迹 f(A4) == tr(4B) 


| 
1 lg 
ny 


6. 6.4 矩阵 对 矩阵 的 微分 
和 矩阵 标量 函数 还 可 以 进一步 推广 到 因 变 量 也 是 矩阵 的 函数 . 一 般 地 ,我 们 称 映 射 
FA E€ RPF(A) E RY 
为 矩阵 值 函数 (matrix-valued function). 显然 ,矩阵 值 函 数 F(A) = ( 三 (4) )pxo 的 元 
素 f; (4) 都 是 矩阵 标量 函数 . 另外 ,前 述 所 有 函数 都 可 视 为 矩阵 值 函数 的 特殊 
定义 6.6.8 设 矩 阵 值 函数 (4) 二 (fi; (4))p,A € R” 的 所 有 元 素 f; (4) 对 拢 
阵 4 的 微分 都 存在 , 则 称 mxp X ng 矩阵 


oF(A) aF(A) .. 9aF(A) 
Qall Qail2 QQ 
aFC) BaFQ) . aF(A) 
Qasl Oa2» Aa2, 
OF(A) aF(A) . 3F(A) 
oa ml oa m2 oa mm 
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FCA 
为 F(A) 对 4 的 微分 , 记 为 于 扩 ) A 或 Ge | ge 其 中 
kl mpXm 


afu(A) 3fu(A) . 3fi,(4) 


Oag Aap Oa 
ofa(A) 9j244) . f(A) 
oF(A) _ Aan Ga Qak 
Qaw 
Ofn(A) fp (MA) | fn‘A) 
QQ Qauw Oak PXg 
T 
而 疝 机 加 已 知 a 一 (qazyas) 人 ， 设 A 二 (zy)pas 求 0) ,dha) 
dA dA 
解 :因为 
3 
Druas 
4=1 3 3 
Aa = 3 ,Aa)T = (Dy xuars >) zaax ) 
A=1 =] 
> ) zaas 
| 
所 以 
Ba(4a)I Cha)I 9 (Aa)T 
dda Qzll Ox Ox13 a 0 Pa 0 1 as 0 
和 三 | 
aa(4a)T Cair aca)r| (0 al0 10 mm 
Qzzl Ox22 OX23 
Qha) 3Ca) aca)1 fa la la 
dday_ | | 
dA |aca) aca) aca)| 101010| 
Ox2l QZz22 Ox23 & | 9 | 0s 


Matlab 中 提供 了 内 置 函 数 jacobian, 调 用 格式 为 
jacobian (f,v) 

可 用 于 计算 标量 函数 f 对 向 量 v 的 梯度 ,以 及 向 量 函数 对 向 量 v 的 jacobi 矩阵 ,函数 
的 返回 结果 是 向 量 或 矩阵 ,其 中 的 (z,7) 元 素 是 df (i)/dv(j). 注意 这 里 自 变量 v 也 可 以 
是 标量 ,此 时 函数 jacobian 相当 于 代码 diff(f,w). 另外 特别 要 注意 的 是 ,计算 梯度 时 返回 
的 一 律 是 行 向 量 . 

内 置 函 数 jacobian 也 可 用 于 计算 矩阵 值 函 数 f 对 矩阵 A 的 微分 ,只 是 其 计算 结果 与 
理论 结果 在 表述 形式 上 存在 很 大 区 别 ,需要 仔细 甄别 . 比如 对 上 例 , 使 用 如 下 代码 : 


Syins X11 X12 x13x2l X22 x23 al a2 a3 
A= [xl11 x12 xl13; x21 x22 x23]; a= [al; a2; a3 ]; 
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f= A* ay R1= jacobian (f,A); 


[al 0 a OO as 01] 
[ 0, al, 0， a2: OO a3] 


6.6.5 成 于 计算 , 败 于 算计 
“尊贵 的 夫人 ,卡尔 。 雅 可 比 (Karl Jacobi, 见 图 6- 11) 愿 意 为 您 效劳 !”“ 哦 ! 雅 可 比 
先生 , 莫 里 茨 是 令 兄 吗 ? 我 真 为 他 骄傲 . ”对 不 起 ,美丽 的 夫人 ,我 不 是 他 的 兄弟 ,他 是 我 


的 兄弟 . ”如 今 ,以 Jacobi 迭代 、Jacobi 矩阵 .Jacobi 行列 式 、Jacobi 符号 、Jacobi 旋转 、Jaco- 
bi 椭圆 函数 、Jacobi 多 项 式 、Jacobi 积分 .Hamilton-Jacobi 微分 方程 …… 不 朽 于 世 的 卡 


尔 , 在 生前 的 名 气 却 远 远 不 如 哥哥 莫 里 菊 。 雅 可 比 (Moritz Jacobi,1801 一 1874) ,因为 莫 
里 茨 是 夫人 们 最 为 关心 的 黄金 加 工 工 艺 电 镀 法 的 发 明 人 (当然 她 们 后 来 大 概 也 明白 了 其 
中 的 “ 洗 金 ” 骗 术 ). 


雅 可 比 出 生 于 普鲁士 一 个 富有 的 银行 家 家 庭 , 自 
小 就 跟着 田 盟 学 习 古 典 文学 和 数学 . 从 一 开始 ,他 就 显 
圳 出“ 多才多艺 的 头脑 ”,12 岁 一 人 中 学 就 被 编 入 毕业 
班 . 因为 柏林 大 学 不 接收 少年 大 学 生 , 他 只 好 在 毕业 班 
里 连续 待 了 好 几 年 . 雅 可 比 反对 靠 死 记 硬 背 来 学 数学 ， 
加 之 老师 欣赏 他 的 数学 天 才 ,同意 他 自学 ,这 使 得 他 在 
高 中 阶段 就 能 够 研读 欧 拉 的 《无 穷 小 分 析 导 论 》, 并 开 
始 研究 五 次 方程 . 考 入 柏林 大 学 后 ,由 于 当时 大 学 教育 
的 水 平 , 柏 林 大 学 提供 给 他 的 东西 ,以 至 于 以 后 在 他 看 
来 ,大 学 的 数学 讲座 就 是 “废话 ” 

雅 可 比 已 决定 要 把 全 部 精力 献 给 数学 ,要 “深入 洞 
察 由 欧 拉 、 拉 格 朗 日 和 拉 普 拉 斯 的 工作 所 堆 成 的 大 山 
的 本 质 ”, 为 此 ,他 开始 以 “最 惊人 的 力量 和 最 艰苦 的 思考 ”, 来 “制服 这 个 庞然大物 ”. 他 是 
如 此 地 勤奋 ,以 至 于 当 一 位 朋友 向 他 抱怨 做 科研 既 艰 苦 也 有 损 健康 时 ,他 大 力 驶 斥 说 : 
“ 那 又 怎样 呢 ? 只 有 卷心菜 没有 神经 没有 焦虑 ,但 它们 完美 的 健康 又 能 给 它们 什么 呢 ??” 
1827 年 ,他 在 高 斯 二 次 剩余 的 基础 上 ,得 到 了 三 次 剩余 的 一 些 成 果 , 并 把 它们 寄 给 了 高 
斯 ,这 赢得 了 高 斯 的 大 力 赞 扬 . 鉴于 高 斯 很 少 称赞 别人 ,这 也 让 教育 部 注意 到 此 事 , 并 决 
定 将 这 个 23 岁 的 年 轻 人 直接 晋升 为 副教授 .两 年 后 , 雅 可 比 发 表 了 他 的 第 一 篇 杰作 “ 椭 
圆 函 数理 论 的 新 基础 ”, 证 实 了 自己 并 非 浪 得 虚名 . 而 他 在 椭圆 函数 上 的 这 种 “新 基础 ”， 
更 是 让 浸 淫 于 椭圆 函数 40 年 的 顶级 专家 勒 让 德 顿 感 自 己 的 成 果 毫 无 价值 “通过 你 的 工 
作 , 你 已 将 自己 置身 于 当前 最 伟大 的 分 析 学 家 之 列 . ”这 是 勒 让 德 对 他 由 囊 地 赞叹 . 

从 1826 年 起 , 雅 可 比 开始 任职 于 哥 尼 斯 堡 大 学 . 在 这 里 ,他 和 弗 朗 蒋 。 诺 依 曼 以 及 
贝 塞 尔 一 起 ,在 教学 中 开创 了 “讨论 班 ? 模 式 , 吸 引 了 许多 学 生 , 其 中 就 包括 海 森 (Ludwig 
Otto Hesse,1811 一 1874, 1842 年 提出 Hessian 行列 式 , 即 H(f) 的 行列 式 ) 和 赛 德尔 
(Philipp Ludwig von Seldel,1821 一 1896 ,贡献 了 Gauss-Seidel 迭代 法 ). 他 鼓励 学 生 在 掌 


图 6-11 卡尔 . 雅 可 比 (1804 一 1851) 
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握 前 人 总 结 的 知识 之 前 ,就 去 尝试 研究 别人 不 曾 做 过 的 工作 , 养 成 独立 工作 的 习惯 . 为 
此 ,他 “ 打 比 方 ” 道 :“ 如 果 你 父亲 坚持 要 先 认 识 世 界 上 所 有 的 姑娘 ,然后 再 跟 其 中 一 个 结 
婚 , 那 他 就 永远 不 会 结婚 ,而 你 现在 也 就 不 会 在 这 里 . ” 

近乎 狂热 的 研究 热情 和 过 度 的 工作 挫 垮 了 他 的 身体 ,1843 年 ,他 被 查 出 得 了 糖尿 病 . 
医生 建议 他 去 意大利 休养 ,这 显然 花费 靡 巨 . 尽管 他 出 生 富 有 ,但 几 年 前 家 里 就 破产 了 . 
经 过 狄 利克 雷 和 洪 堡 (Alexander von Humboldt,1769 一 1859, 被 誉 为 德国 的 “科学 王子 ” 
和 “新 亚 里 士 多 德 ”, 他 的 哥哥 威廉 创立 了 洪 堡 大 学 ) 的 协助 ,非常 重视 荣誉 的 普鲁士 国王 
腓 特 烈 . 威廉 四 志 (1795 一 1861，1840 一 1861 年 在 位 ) 给 了 他 一 笔 不 菲 的 津贴 ,并 且 同 意 
他 “愿意 休息 多 久 就 休息 多 久 ”, 后 来 更 允许 他 住 在 气候 更 适宜 他 的 柏林 继续 养病 . 

到 了 1848 年 ,欧洲 大 陆 开 始 动荡 . 此 时 医生 开 出 了 一 个 极为 患 春 的 “处 方 ”, 那 就 是 
“政治 或 许 对 他 的 神经 系统 有 好 处 ”. 雅 可 比 被 选 为 一 个 温和 自由 派 的 候选 人 ,参加 5 月 
份 的 大 选 . 他 发 表 了 一 篇 动人 的 讲话 ,让 政治 家 们 意识 到 “这 是 一 位 登 上 了 食 人 岛 的 .天 
真 无 知 又 有 着 诱 人 肥胖 的 传教 士 ”. 在 自由 派 看 来 ,他 领取 国王 的 津贴 ,是 保皇 党 人 的 密 
探 ;在 保皇 党 看 来 ,他 是 叛徒 . 盛怒 的 国王 干脆 停止 了 津贴 ,这 位 因 计 算 而 成 名 的 数学 家 ， 
最 终 败 给 了 一 场 算计 . 一 位 朋友 收留 了 他 的 妻子 和 七 个 孩子 ,这 位 数学 天 才 则 隐居 在 旅 
店 一 间 及 脏 的 房间 里 ,继续 自己 的 数学 研究 . 维也纳 大 学 得 知 雅 可 比 的 困境 ,开始 设法 接 
他 过 去 ,但 被 洪 堡 及 时 阻止 了 . 洪 堡 说 服 了 怒气 冲冲 的 国王 ,因为 “德意志 需要 留 住 她 的 
第 二 个 伟大 人 物 雅 可 比 ”. 津贴 最 终 恢复 了 ,但 雅 可 比 经 此 动荡 ,身体 更 加 糟糕 ,三 年 后 即 
1851 年 ,他 染 上 了 流感 ,进而 死 于 天 花 . 
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利用 分 析 学 的 理论 ,可 以 将 非 线性 问题 近似 成 线性 问题 . 事实 上 ,用 “线性 化 ”处 理 非 
线性 问题 是 一 种 重要 的 思维 方式 ,比如 控制 中 的 线性 系统 理论 ,其 中 最 典型 的 就 是 线性 
微分 方程 组 在 线性 系统 中 的 应 用 . 


6.7.1 线性 常 系数 微分 方程 组 
我 们 知道 ,线性 常 系数 齐 次 微分 方程 
X(t)=ar(t), z(t)= zo C6.7.1) 


的 通 解 为 X(?) 二 ee To， 
将 xz(7) zo 推广 到 向 量 ,将 系数 a 推广 到 对 角 和 矩 阵 、 块 对 角 和 矩阵 乃至 任意 矩阵 , 即 对 
于 线性 常 系数 齐 次 微分 方程 组 


x (1t) = Ax(t), x(i) = wo C6, 7., 2》 


上 述 结论 仍然 成 立 吗 ? 
事实 上 ,与 例 2. 5. 2 中 类 似 ,注意 到 Jordan 分 解 A = PJP- , 则 


x (1) = Ax(t) = PJP x(1) 
同样 , 令 y(z) = PTxG) , 则 方程 组 的 最 简 解 耦 为 y (0 = Jy (1). 类 比 可 知 ,这 里 应 
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y(zt) | em) yo Eb hi PP 1Xo 
从 而 x(b = Py (b 一 Pei 和 ro)P xo = exo 
定理 6.7.1 线性 常 系数 齐 次 微分 方程 组 (6. 7. 2) 的 通 解 为 
XE) = eT wo (0. 7. 3 
这 里 ， x(1) (CD 为 未 知 向 量 ， A = (Qs ) xn 是 常数 矩阵 ， 0 = x(to) 
(Zi (to) 本 ,Ta (Wo) )T 为 初始 条 件 . 
证 明 : 由 于 (e*x(2)) 一 64 (一 A)xQ) 十 e*x'(z) 一 0, 两 边 积 分 得 | (ex(C)) ds 一 0， 
此 即 e*xQ) 一 e*ox(w) == 0, 于 是 xQ) = 二 ox(w). 证 毕 . 
显然 方程 (6. 7. 1) 是 方程 组 (6. 7. 2) 退化 到 n = 1 时 的 情形 . 
例 6.7.1 求 线 性 常 系数 齐 次 微分 方程 组 
zx! (1) = 十 zs 
zx/ (1) 一 一 4x1 十 3zz 


zs (1) = Ry 二 2x3 


满足 初始 条 件 x(0) 一 (zi (0) ,zs(0) ,zx3(0))T = 二 (1,1,3)T 的 特 解 . 
解 :显然 方程 组 的 矩阵 形式 为 x (1) = Ax (1), 这 里 


一 1 
A= |=4 3 0|l,yx= (wz) ts (DD) = (zl wf Ct) ,wd CE YT 
1" tf 2 


根据 定理 6. 7. 1, 注 意 到 二 0, 因此 方程 组 的 解 为 x(1) 一 esx (0). 
例 2. 5. 1 中 已 求 得 矩阵 4 的 Jordan 分 解 ,因此 


ez! e’ — 2te! te’ 0 
=Pep*=P| etelp =| —de 2te te 0 
ef e—e’+2te e*—te—e ee 
从 而 所 求 特 解 为 
一 和 一 二 0 
X(1) = ex(0) = |— (21— 1)e 
ie' 十 3e2 


我 们 知道 ,线性 常 系数 非 齐 次 微分 方程 
XD) =ar(t)+f), z(t)= zo (6. 7. 4) 
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的 通 解 为 xD) 二 em zo 十 | ec? f(s)ds, 即 “ 非 齐 次 的 通 解 是 齐 次 的 通 解 加 上 非 齐 次 


的 特 解 ”. 
根据 前 面 的 分 析 , 我 们 自然 也 会 问 :将 zx(2) ,zo 推广 到 向 量 ,将 系数 a 推广 到 对 角 拢 
阵 、 块 对 角 和 矩阵 乃至 任意 矩阵 , 即 对 于 线性 常 系数 非 齐 次 微分 方程 组 


x (1) 一 4Ax(CD 十 FD，x(G) = xo (6.7.5) 
上 述 结论 仍然 成 立 吗 ? 
定理 6.7.2 线性 常 系数 非 齐 次 微分 方程 组 (6. 7. 5) 的 通 解 为 
x 一 +| tr fs) ds (6. 7. 6) 
这 里 , f(2) 二 《i101),…,f,(1))', 其 他 与 定理 6.7.1 相同 . 
证 明 : 用 e* 左 乘 方程 (6. 7. 5) 两 边 ,并 整理 得 
e4x' (1) es(—A)x() = e*f (1) 


此 即 (ex (2)) 二 @e*f(7). 对 此 式 两 边 积 分 ,得 e*x(1) 一 e*%x(to) 一 esf(s)ds. 


再 用 e* 左 乘 此 方程 两 边 , 整 理 后 即 得 所 需 结 论 . 证 毕 . 

例 6.7.2 已 知 线性 常 系数 非 齐 次 微分 方程 组 Y (z) = Ax (1) 十 JGD)， 这 里 这 里 人 
同 例 6.7.1, f(z) 一 (e',e',e*")7, 求 其 满足 初始 条 件 x(0) = (1,1,3)7 的 解 . 

解 : e* 的 计算 结果 见 例 6. 7. 1. 而 


1 
= 一 De | Bt 
工 
X= x0) 一 | 一 (2 一 De lesFGs) 一 | 2 十 1 | e*f (ds = tt 十 1) 
te 十 3e2 =8 1 4 1 
和 一 二 一 二 
这 样 , 非 齐 次 方程 的 特 解 为 
i 
ptt 2)e 
Xp 一 et | esf(s)ds 一 —t(t— 1)e 
六" 一 记 十 六 te 
因此 ,所 求 为 
一 二 (一 2e 
X= x 十 XxXy 一 一 (ff 十 + 一 1)e 


ee 有 总 ee < Bet 42)e 
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在 上 述 通 解 中 ,主要 的 计算 量 集中 在 e 上 .我 们 当然 可 以 借助 expm 来 编程 实现 . 
不 过 ,Matlab 中 已 提供 了 内 置 函数 dsolve, 可 用 于 求解 微分 方程 的 符号 解 ,其 调用 格 
式 为 


dsolve (GaL17 "eq2; GOnGL 7 GOnQ2 ,sur Vv) 


其 中 ,eq 部 分 为 待 求 解 的 微分 方程 ,用 字符 串 形 式 编写 ,其 余部 分 则 根据 需要 来 确定 . 
前 面 两 个 例题 的 计算 代码 为 : 


syms t xl x2 x3 % 声明 符号 变量 
[x1, x2,xX3]= dsolve ('Dx1l= - 1* xl+ x2','Dx2= - 4* xl+ 3* x2',... 
'Dx3= xl+ 2* x3','x1(0)= 1','x2(0)= 1','x3(0)= 3') $$ ... 是 续 行 符 
xh= [xl;x2;x3] 当 齐 次 方程 的 通 解 x 
[x1, x2, x3]= dsolve('Dxl= - 1* xl+ x2+ exp(t)','Dx2= - 4* xl+ 3* x2+ exp(t)',... 
'Dx3= xl+ 2* x3+ exp(4* t) 'x1(0)= 1','x2(0)= 1','x3(0)= 3') % ... 是 续 行 符 
x= [xl;x2;x3] % 非 齐 次 方程 的 通 解 x 


上 述 代码 中 , 自 变量 v 采 用 了 缺 省 自 变量 t,“Dx1” 表 示 Si 2 ,其 他 依 此 类 推 . 如 果 
要 表示 人 2， 则 使 用 *Dny” 诸如 Y(c) 二 d 这 样 的 边 值 条 件 , 则 可 以 表示 为 “Dy(e) 一 路 


6.7.2 应 用 :线性 定常 系统 的 状态 转移 矩阵 
考虑 线性 定常 连续 系统 的 状态 方程 
x (2) 一 (区 十 BC( 区 (为 ) 一 2 (th) (6. 7,.7) 
按 定理 6. 7. 2 可 知 ,其 通 解 为 


二 
(六 一 ear 十 | es Bu (Cs) ds (6, 7. 8) 


其 中 ,第 一 项 是 零 输 入 响应 , 它 是 由 初始 状态 引起 的 系统 自由 运动 ;第 二 项 是 零 状态 响 
应 , 它 是 由 控制 输入 wu(z) 所 产生 的 受 控 运 动 . 


在 通 解 (6. 7.8) 中 , 记 ®B(1,t0) 一 est, 则 xi) 二 (4,4o) mn +| Dt,s) Bu (ls)ds, 


显然 ,矩阵 @B(1,4) 起 着 一 种 状态 转移 的 作用 ,表征 了 从 初始 状态 xo 二 x(1o) 到 当前 状态 
x 一 xD) 的 转移 关系 ,即时 刻 的 状态 xo 被 线性 变换 到 时 刻 1 的 状态 x (7), 因此 它 被 称 
为 状态 转移 矩阵 ， 事实 上 ,从 本 质 上 看 ,无 论 是 初始 状态 引起 的 零 输 入 响应 ,还 是 由 输入 
引起 的 零 状 态 响 应 ,都 是 一 种 状态 转移 ,都 可 用 状态 转移 矩阵 来 表示 ,因此 状态 转移 矩阵 
是 对 线性 系统 进行 运动 分 析 的 基本 工具 . 这 也 解释 了 何以 矩阵 指数 函数 在 现代 控制 理论 
中 如 此 重要 ,何以 控制 界 如 此 喜爱 Matlab 软件 . 另外 ,一 旦 确定 矩阵 4, 就 唯一 确定 了 甜 
阵 指数 函数 。 ,也 就 唯一 确定 了 状态 转移 矩阵 @(t,to). 从 这 个 意义 上 说 ,和 矩阵 刻画 了 对 
象 的 运动 ,其 本 质 是 运动 的 描述 . 还 是 那 句 话 ，“ 和 矩阵 即 变换 ” 
对 于 状态 转移 矩阵 B(z,to), 易 证 它 满足 微分 方程 
D110) = ABUt), Dt,to)=1 (01) (6. 7. 9) 
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并 且 具 有 自 反 性 (i,t) 一天 反 身 性 加 11) = 二 (4o,7) 以 及 传递 性 (t,t) = (i， 
11)B(ti ,4o). 这 些 结论 显然 与 下 列 变 换 关系 是 吻合 的 : 


D1 to) D1 ,11) 
X(t ) i (ss) 
t 


x(to) = 
全) 至 雹 过 


po! 


6.7.3 和 矩阵 微分 方程 
考虑 一 系列 线性 微分 方程 组 
x 1(t) = A(z) Xi1(1), Xi (to) Se 


x (Ci) = A() WoL (mm) ey 
(6.7.10) 


Ea = A x x (hy = 


这 里 , A(7) 是 定义 在 (to,t) 上 的 分 段 连续 函数 矩阵 . 这 些 方程 组 具有 相同 的 系数 矩阵 
A(z), 我 们 自然 希望 将 它们 合并 在 一 起 进行 研究 . 
令 针 (DD) 二 CCD (oo(D)，C 一 (cc 则 式 (6.7.10) 就 变 成 了 矩 
阵 微分 方程 
Kt) = ACKXG), Ko)=C (6; 7, 11) 


其 中 , C 称 为 初始 矩阵 . 方程 (6. 7. 11) 两 边 从 t 到 上 积分 , 即 得 其 隐 式 解 为 
= C+) AWXG)d (6. 7. 12) 
另外 ,方程 (6.7. 11) 的 解 X(t) 满足 Jacobi 恒等式 : 
detX(1) = detC。 exp | trA(s)ds C6 .48 


TQ) CD) Zn (GD MA Zh 


证 明 : XO| = 和 as S00 一 Da Dr “0 Da; Dx, 
1 一 1 7 一 1 


7 


aa Ta DD) a x, 2) 


X11 (2) se TE) 


= ， Qj (2 rn tt) ene ay (1) Tm (t) 


Tn (7) … 二 
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x1 (t) DD in) 
一 >) asxalt) 1 ai(t) za lt) 
证 境 


wa (2 … Tm (zt) 


x11 Ct) Be Zin (£) 
一 | 兽人 (六 | Svas i) 
i 一 1 


Tailt) se mt) 


= |X() |trACz) 
于 是 dX A dt. 两 边 从 到 zt 积分 ,可 得 ln|X(z)| ||; 二 | trA(s)ds, 也 


| XC) | 
就 是 
工 
ln fe =| tacod 


因此 |X()|= ICl expC] trAGs)ds). 证 毕 . 


由 Jacobi 恒等式 可 知 , |C| 关 0, 即 和 矩阵 C 可逆 时 , | 头 (z) | 关 0 即 站 (z) 也 可 道 . 这 意 
味 着 初始 和 矩阵 C 的 奇异 性 决定 了 解 半 (2) 的 奇异 性 ,那么 不 同 的 C 确定 的 解 和 Ci 之 间 又 
存在 什么 样 的 关系 呢 ? 

考虑 矩阵 微分 方程 


X (1) 一 4(CDXCGD，XCG) 一 工 (6.7. 14) 
并 记 其 解 为 已 (7). 


注意 到 方程 (6.7. 11) 的 初始 条 件 XGn) =C= 工 .C 一 X(o)C, 若 令 (1) 一 

Xo (zt)C, 则 有 
X(t) = X00DC= AX DC = A XG) 

这 意味 着 方程 (6. 7. 11) 的 解 关 (z) 可 以 用 方程 (6. 7. 14) 的 解 X (5 表示 出 来 ,因此 
我 们 称 XX (7) 为 A(z) 的 基本 解 矩阵 . 

那么 基本 解 和 矩阵 X(t) 又 如 何 表示 呢 ? 

注意 到 当 X(z) 退 到 为 列 向 量 时 ,方程 (6. 7. 14) 退化 为 常 系数 线性 齐 次 微分 方 
程 组 (6. 7. 2), 类 比 式 (6.7.3), 这 是 否 意 味 着 方程 (6. 7. 14) 的 解 应 该 是 (2) = 


exp | A(s)ds 呢 ? 
将 Xo (zt) 展开 成 矩阵 寡 级 数 ， 
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Xp) = 上 Di( 六 一 工 十 五 + i 
并 令 L(G) =| A dt; 则 LC) = A(4), 从 而 
X= L002) 十 而 GD 下 总 
二 A(t) 十 起 (ACLC) LACO) + 


又 因为 
A Kt = AC) AILO) 十 友 王 全 ey) 
= A(Q) AWLG) 十 ADL CD) se 


因此 ,只 有 当 AQWLG) 一 工 (D4(CGD 时 , 才 有 马 (G ==AQ) 和 (2), 此 时 方程 (6.7.11) 的 
解 为 | 


X() = exp | ACNds sO (6.7. 15) 


6.7.4 应 用 开 : 线 性 时 变 系统 的 状态 转移 矩阵 
根据 矩阵 微分 方程 理论 ,线性 时 变 系统 的 齐 次 状态 方程 
X(t) 一 ACDXCDO x(t) = xo (tt) (6. 7. 16) 
的 通 解 应 为 


二 站 = 融合 区 = xp | a 《6.7. 17) 


其 中 ,基本 解 矩 阵 Xo (z) 为 下 列 方程 的 解 : 
X(t) = A KX) ,KG) 一 工 (6. 7. 18) 

显然 ,由 式 (6.7. 17) 可 知 基 本 解 矩 阵 X, (7) 仍然 起 到 状态 转移 的 效果 ,那么 它 是 否 
还 具有 @(z) 的 性 质 呢 ? 

将 方程 (6. 7. 17) 的 通 解 记 为 x(f) 二 g(t; xo ,to), 容易 验证 此 通 解 对 初始 条 件 是 线 
性 的 , 即 

Pltsaxi tt bx2 ,to) = apltyxi,to) t+ bp ts; x ,to) 

因此 ， plt; al to) ,pt; az ,to) DC 0 线性 无 关 当 且 仅 当 QI，Q2，…，Q， 也 线性 


无 关 . 
设 Xo 一 (ki ,kk2 DT 注意 到 Xo 二 kiel 十 ze 十 Se 二 ens 因此 


x(t) = Plt;Xo ito) = Dkipltse; ,to) = (p(t;e ,to) ,pte sto) ,plt;e, sto)) Xo 


i 一 1 
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显然 ,上 式 中 的 和 矩阵 《CpGisel to) pltses to) ,pts ;@;to)) 起 到 了 @B(1,to) 的 效果 ， 
我 们 仍 记 之 为 B(1,to). 易 知 B(i,to) 满足 方程 (6.7.18), 因此 它 就 是 基本 解 和 矩阵 
Xo(t), BP X(t) = ye 

如 果 以 方程 (6. 7. 18) 的 邯 个 线性 无 关 解 为 列 构成 矩阵 Y(D， 则 有 Y(D) = Xo CC， 
这 里 的 初始 矩阵 C= 二 YY(wo), 因此 (t,to) = 和 (CD) 二 Y(t) CT. 由 此 出 发 ,显然 也 可 以 证 
明 @(z,io) 具有 自 反 性 @(i,t) = 二 T、 反 身 性 (i,4o) 二 (to,t) 以 及 传递 性 (t,to) 一 
Dt; ,11) Dt ,to). 这 些 结论 同样 与 下 列 变换 关系 是 吻合 的 : 


Dl to) Dt, ,1 ) 


x(to) = x(t1) 3 Xi) 
®@ (tn) (12 141) 
对 线性 时 变 连续 系统 的 非 齐 次 状态 方程 为 
x (1) = ACxXD BAOu), x(to) = x (tw) (6. 775 19) 


类 比 可 知 ,其 通 解 应 为 x(1) = exp( | ‘ ACD dr) » xb) + | exp(| AD A Bu ds, 即 


X(t) = Di,to) xo a Bt,) BC) uCs) ds (6.7.20) 


其 中 ,第 一 项 仍 是 由 初始 状态 引起 的 系统 自由 运动 , 仍 称 为 零 输入 响应 ;第 二 项 仍 是 由 控 
制 输入 所 产生 的 受 控 运 动 , 仍 称 为 零 状 态 响应 . 

证 明 : 根 据 前 面 的 分 析 , 线 性 时 变 系统 的 输出 是 零 输 入 响应 和 零 状 态 响应 的 笃 加 , 因 
此 可 设 方程 (6. 7. 19) 的 通 解 为 


X(t) = BD,to) wo Bt,to) y(t) (6. 7. 21) 
两 边 对 上 求 导 ,得 
x (= Bt) Ko ty + Bt )y (1) 
= A(DBGt) Ko ty HB,t)y (1) 


= A(DX(1) + Bt,to)y (7) 


_ dx(7) 


gr Bu + Bt,to)y (1) 


此 即 
y (0) = [®t] BOu) = D0,1) BU) 
对 上 式 两 边 从 to 到 上 积分 ,并 注意 到 y(to) = 0, 即 得 


T 下 
y(t) = y(to) +| Dto,s)B(s)uls)ds = D1o,s)B(s)uls)ds 
将 上 式 代 入 式 (6. 7. 21), 并 注意 到 @(z,m) 的 传递 性 ,可 得 


xD 一 GD) xo + DL) | Bs,s) BuCs) ds 


= @D(t,to) xo +| Dt,s)B(s)u(s)ds 
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证 毕 . 

至 此 ,我 们 发 现 线性 定常 系统 和 线性 时 变 系 统 具 有 统一 的 表示 形式 . 当然 ,前 面 已 提 
及 ,只 有 当 A(DLC) 二 L(1)A() 时 ,线性 时 变 系统 的 状态 响应 才 具 有 上 述 封闭 形式 . 这 
个 条 件 在 实际 中 一 般 不 成 立 ,因此 这 种 统一 的 表示 更 具有 理论 意义 . 


6.7.5 应 用 II: 线 性 时 变 系统 的 能 控 性 和 能 观测 性 


对 一 个 控制 系统 ,存在 kalman 提出 的 两 个 基本 问题 : 
(1) 在 有 限时 间 内 ,控制 作用 能 否 使 系统 从 初始 状态 转移 到 要 求 的 状态 ”此 即 控制 
作用 对 状态 变量 的 支配 能 力 , 称 为 状态 的 能 控 性 问题 . 
(2) 在 有 限时 间 内 ,能 否 通 过 对 系统 输出 的 测定 来 估计 系统 的 初始 状态 ?此 即 系统 
的 输出 量 能 否 反 映 状态 变量 , 称 为 状态 的 能 观测 性 问题 . 
定义 6.7.1 对 于 线性 时 变 系统 
x (t) = A x) tBu) (6. 7. 22) 


如 果 在 任意 有 限时 间 区 间 [am ,tj 内 ,都 存在 控制 向 量 uCz), 能 将 系统 从 初始 状态 x(10) 
转移 到 任意 终端 状态 xn ), 则 称 此 系统 是 能 控 的 . 

如 何 判 定 系 统 的 能 控 性 呢 ? 

定理 6.7.3 线性 时 变 系统 (6.7. 22) 在 定义 时 间 区 间 [to ,tj 内 状态 完全 能 控 的 充 
要 条 件 是 Gram 和 矩阵 W. (wo,) 非 奇 异 ,其 中 


W(to ,ti) = | Dto,s)BCs) BIGCD)GTICs)ds 


称 为 能 控 性 矩阵 . 
事实 上 ,构造 控制 向 量 wz) = 一 BTCODOGICD WCG)xzG)， 则 


| Bs, BCs)ds= 站 Ds YB) BT CYT Ci DEC 


— D(H RD) W. (to 1) 和 Wa (to stl x(to) Dt D1 sto X(t) 
将 上 式 代入 式 (6. 7. 19), 可 知 


XCL1) = Dl so Xo 二 | D1 ,5)B(s)uls)ds Dt sto2 Xo —@D( yto) Xo = 0 


这 说 明 任何 初始 状态 x(w) 在 时 间 [i ,内 都 可 以 被 转移 到 零 状态 . 

定理 6. 7. 3 从 理论 上 给 出 了 线性 系统 是 否 完全 能 控 的 统一 判别 准则 ,但 用 于 实际 则 
要 计算 状态 转移 矩阵 , 则 显然 存在 困难 . 特别 地 ,对 应 线性 定常 系统 ,必须 寻找 更 加 方便 
的 判别 准则 . 

对 于 线性 定常 系统 


x (1) = Ax (1) + Bult) (6. 7. 23) 
假设 x(4) ==0 且 w= 二 0, 则 由 式 (6.7.8) 可 知 


0 x(tn) = BY 十 | e40 7 BCs)ds 
0 
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nl 
从 而 x(0) = 一 | ‘es%Bu(s)ds. 再 由 Cayley-Hamilton 定理 ,可 设 e* 一 a (5s)A*, 
0 k=0 


B 3 (bi ,bs,**,b,), B; = ax (5s) uj;(s)ds (7 = ss pb) 


L ml 证 -法 1 
x*(O0) 一 一 | (>) ar(s) A*)Buls)ds 一 一 >， 44B | ax CS) uls) ds 
0 k=0 k=0 0 


| a Vu ds 
; hi 
| 
ml | ax (SsS)Us Cs)ds Ln! Bs 
=— 2) ABI? 一 一 2)44B 
k=0 k=0 
4 Bb.» 
| ax(s)up(s)ds 
Bi Bi 
7 一 1 PB.2 ?一 | Bs 
一 一 >) At (bi,b,,…,b,) 一 一 >) (Atp1,A‘bi,…,A*b,) 
k=0 : k=0 : 
PB, B., 


记 W. = (bi, b,,.…, b,,*…,A™ bl ,A™ bs,*…A”™'b,), 下 一 (poi 区 
i105B12，…,BB1.,)"， 则 上 式 变 成 了 方程 组 Wi = 一 x(0). 如 果 其 系数 矩阵 即 nxXnp 
阶 矩 阵 W. 行 满 秩 , 则 从 此 方程 组 可 求 得 控制 信和 号 元 

定理 6.7.4 线性 定常 系统 (6. 7. 23) 在 定义 时 间 区 间 [4 ,六 ] 内 状态 完全 能 控 的 充 
要 条 件 是 能 控 性 矩阵 W. ==(B,4B,…,A”"1B) 行 满 秩 . 

定义 6.7.2 对 于 线性 时 变 系 统 

x (tf) 一 人 (ix 
(6. 7. 24) 
y(t) 一 CCD)X(CL) 

如 果 在 任意 有 限时 间 区 间 [w ,tj 内 ,都 能 通过 观察 系统 的 输出 向 量 y(z1) 而 唯一 地 
确定 系统 的 初始 状态 x(z), 则 称 此 系统 是 能 观测 的 . 

如 何 判定 系统 的 能 观测 性 呢 ? 

定理 6.7.5 线性 时 变 系统 (6. 7. 24) 在 定义 时 间 区 间 [am ,tj 内 状态 完全 能 观测 的 
充 要 条 件 是 Gram 矩阵 W(to ,ti) 非 奇异 ,其 中 


W, (to ,1) = | IC zi) CT(s)CCs) Ds ,to ) ds 


被 称 为 能 观测 性 和 矩阵. 
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事实 上 ,因为 x(i) 一 加 (tt)x(t) 所 以 (一 CCG)xCGD) = 二 C0)@D(i,to)x(to), 从 而 
| D's,to) CT (s)y(s)ds= (| B's,t0) CT SICCG) Ds ,to) ds) » x(to) 


= W, (to ,ti1)x(to) 
所 以 , 当 W,(wo ,#1) 非 奇异 时 可 唯一 确定 x(to). 
定理 6.7.5 从 理论 上 给 出 了 线性 系统 是 否 完全 能 观测 的 统一 判别 准则 ,但 用 于 实际 
也 要 计算 状态 转移 矩阵 ,显然 也 存在 困难 . 对 于 线性 定常 系统 ,也 必须 寻找 更 加 方便 的 判 
别 准 则 . 
对 于 线性 定常 系统 


x (1) = Ax(1) 
1 (6., 7.25» 
y(t) = Cx (1) 


假设 二 0, 则 x(1) = es*x(0). 由 Cayley-Hamilton 定理 ,可 设 
e* 一 Hak) MD = (go WT, (DT ,0 (0D 
从 而 
y(1)= Cr(t) = Ces'x (0) 一 c(Sa A* )x (0) 


C 
= (@o DT,o DDT, ,0 1Ct)T) ,|x(0) = UW,x (0) 


CA™! 


即 有 方程 组 y(7) 二 UW。x (0), 其 中 WI 二 (C,C4,…,CA"!). 由 于 矩阵 U 非 奇异 ,因此 当 
和 矩阵 W 列 满 秩 时 ,由 输出 向 量 y(z) 可 得 初始 状态 x(0). 

定理 6.7.6 线性 定常 系统 (6. 7. 24) 在 定义 时 间 区 间 [t,t] 内 状态 完全 能 观测 的 
充 要 条 件 是 能 观测 性 矩阵 W, 列 满 秩 ,其 中 


CA 


Ba 
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.14 


. 15 


16 


用 定义 6. 1.2 证 明定 理 6. 1. 2. 
用 定理 6. 1.2 证 明定 理 6.1.3. 


判断 下 列 短 阵 是 否 为 收 化 答 阵 : 
0.1 一 0.7 0.3 
1 下 一 8 
| )， 全 ) 和 二 | 一 03 6.1 | 
6\—3 1 
0.4 0 0.2 
0 a 
问 & 取 何 值 时 ,矩阵 4 一 |la 0 a| 是 收敛 矩阵 ? 
& 太 0 
判断 下 列 和 矩阵 协 级 数 的 伊 散 性 : 
a 1 /1 1Y m/l 2 
0 a 中 he 
i /0.2 0.7\4 
试 求 乱 隆 军 级 数 》) es | 的 和 . 
Wr” 上 的 Neumann 级 数 收敛 的 充 要 条 件 是 po(4) 二 1. 
2 -1 1 
证 明 : A 二 |] 1 1 | 对 Jacobi 迭代 不 收敛 ,但 对 Gauss-Seidel 迭代 却 是 收 
和 


化 的 . 
若 Ax 二 b 的 系数 矩阵 A 是 实 对 称 矩 阵 , 且 对 角 元 都 为 正 数 , 则 Jacobi 迭代 收敛 的 
充 要 条 件 是 4 之 0 且 2D 一 4 之 0. 

若 Ax 二 了 b 的 系数 矩阵 A 二 0, 则 Gauss-Seidel 迭代 是 收 伊 的 . 

若 委 严格 对 角 占 优 且 且 对 角 元 都 为 正 数 , 则 A 二 0. 


证 明定 理 6. 3.4 的 充分 性 . 
ti = isint 
设 A() 一 ho . ) 求 A [LAC)T, |ACD1' 及 |A'00)|; 
sint COSL 
证 《下 栈 呈 提 
设 4C) js 求 | ACDdi. 
求 下 列 和 矩阵 的 Smith 标准 型 ,并 指出 其 不 变 因 子 、 行 列 式 因 子 和 初等 因子 : 
3 _ 区 2 名。 二 
yaw = |2 a a pa 
和 2 十 5 3 0 Qa—1) 
lA A: A 
(3) 4 一 A 从 —A | 


1 十 12 2 一 和 
已 知 5 阶 算 阵 A(X) 的 秩 为 4, 且 其 初等 因子 为 1 十 1 十 1, 十 1D)2,) 一 1， 
(2 一 1)?, 求 A() 的 Smith 标准 型 . 
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条 


忆 站 和 


.17 


18 
19 


.20 


21 
22 
23 
24 


.25 


.26 


27 


28 


29 


.30 


31 


32 
33 


求 和 矩阵 A 的 最 小 多 项 式 ,其 中 
—] 一 各 0 

(1)A= |—1 0 3|;(2)A= diagCJ;(),J(1),T (2),J(2),J(3)). 
el ee 


证 明 : 短 阵 4 可 对 角 化 的 充 要 条 件 是 A 的 最 小 多 项 式 没 有 重 根 . 
利用 上 一 题 的 结论 证 明 需 等 矩阵 一 定 相 似 于 对 角 和 矩阵 . 

设 AE C”™ ,证明 : 

(1) sin:A+cos’A = I1; (2) sin(A++2xil) = sinA; (3) er 一 e4. 
设 4E CC ,证明 ule*) 之 e*%, 其 中 的 范 数 ulA 和 A) 为 答 阵 和 A 的 相 容 矩 阵 范 数 . 
证 明 : (es)H 一 ed 

证 明 : 若 A 为 反 Hermite 答 阵 ( 实 反 对 称 矩 阵 ) , 则 ee 为 本 矩阵 ( 正 交 矩阵 ). 
已 知 n 阶 矩阵 A 满足 A? 一 工 求 @、sinA 和 cosA. 


1 0 0 
已 知 答 隆 A 二 |-1 2 一 1 , 求 和 矩阵 函数 ew 、sinA、cos(nA) 和 arctan 入 ， 
0 0 2 
计算 下 列 矩 阵子 数 : 
0 —1 
WA=() 来 e、A1 及 InA; 
2 1 0 
(2)4 王 |0 0 1|, 求 arctanA; 
0 10 


(3) A 二 diag(J:(1),J3(2)), 求 e* 及 sinh. 


b 
设 4 一 ( ),a2e R ,来 e*. 特别 地 , 当 & 一 0 且 0 一 1 时 ,et 一 ? 
= a 
一 时 性 
已 知 矩 阵 4 一 一 和 写 仙 , 求 可 遂 和 矩阵 已 和 己 ,使 得 已 eaP 和 已 sin4.P， 
1 0 2 


均 为 Jordan 标准 型 . 


设 f(A) 在 A 的 谱 o(A) 上 有 定义 , 试 证 f(AT) 在 A 的 谱 s(A) 上 也 有 定义 ,并 且 


f(4') = (fA))T. 


2 @ 
由 示 起 


及 A= | 
仅 ] 2 


sin5t + sint 2sin51— sint 


Br i = ( 2 求 矩 阵 A. 


sin5t— sint 2sin5t + sint 
1 
设 入 是 可 北 短 阵 , 求 | sin(At)di, 
当 汪 一 (ay )wxn 可 逆 时 ,证 明 : 
于 = =1yT, ad cn 一 1 —1 NT 
(1D) 了 nl4| (4 ) 5 (2) Ta14 [二 一 | 入 [人 
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6.37 


6. 38 


6.39 


6. 40 


矩阵 分 析 与 计算 


已 知 常数 甩 E 民 ”* 和 未 知 短 阵 是 CE 民 2o， 设 f(X) 二 tr(XTBX), 试 求 Hf. 
设 函 数 徐 阵 A(i) 是 可 积 的 ,证 明 ， 
G) | 上 | | IA has; 

to 1 to 


(2) | | Als)ds ls 过 | |ACs) lsds; 


| AVal <| lava 
线性 常 系数 齐 次 微分 方程 组 
Xi1(t) = 3zl 十 8zs 
| = 3 而 一 过 二 6 
ZX3(t) 一 一 2zl — 5z3 
满足 初始 条 件 (zx1(0) ,xz(0) ,zs(0))T 一 (1,0,1)T 的 解 . 
求 微分 方程 x (Ci) 二 Ax (1) 满足 初始 条 件 x(0) 的 解 ,其 中 


3 一 1 1 | 2 —1 1 1 
(1)A=|2 0 —1|,x(0)=|1;(2)A=|0 3 —1|,x(0)= |1|. 
1 一 1 2 0 盆 站， 治 1 
求 微分 方程 x (1t) 二 Ax (1) 十 DC 满足 初始 条 件 x(0) 的 解 , 其 中 
2 2 一 2 1 0 
A=|2 5 一 4|，,，p) 一 ex| 2 |,x(0)= |1 
一 2 一 4 5 一 2 1 


验证 sinA(t) 和 cosA(t) 满足 二 阶 和 矩阵 微分 方程 壬 (1) 十 A?XX() 一 DO, 并且 当 人 可 
逆 时 ,此 方程 在 给 定 初始 条 件 慎 (0) 一 Xo,X (0) 二 Xi 下 的 解 为 
X(t) = (cos4(i)) Ko (sinA(1)) A xX 

为 了 求解 微分 方程 I” 十 a ix 了 十 … 十 aix 二 0 的 解 工 二 xX(1), 令 

N= Ly = = = TD ,yy = x 
则 原 方程 变 成 微分 方程 组 

六 一 ya = Yar yt = Yay =— a ys — "a2 ya — a1y 

利用 给 阵 技术 可 求解 上 述 微 分 方程 组 ,从 而 求 得 yi 即 式 二 x(t1). 据 此 , 求 下 列 微 
分 方程 的 通 解 : 

X(t)—37r (十 2z() = 0, rto) = cx (to) = eo 


了 计 
特征 值 问题 


“特征 ”一 词 来 自 德语 的 eigen, 由 希 尔 伯 特 在 1904 年 首先 在 这 个 意义 下 使 用 . eigen 
一 词 可 翻译 为 “自身 的 ”,“ 特 定 于 …… 的 ”,“ 有 特征 的 ”或 者 “个 体 的 ”, 这 些 译 法 强调 了 特 
征 对 对 于 定义 特定 的 变换 是 很 重要 的 ,也 反映 了 特征 对 对 于 凸显 个 体 “ 个 性 ”的 重要 性 . 
例如 人 脸 识 别 中 的 “特征 脸 ” 技 术 , 就 是 将 所 有 面 像 集合 视 为 一 个 面 像 子 空间 ,并 基于 检 
测 样品 即 个 体面 像 与 其 在 各 子 空间 的 投影 之 间 的 距离 ,从 而 提取 出 个 体面 像 的 代数 特 
征 , 进 而 作为 人 脸 识 别 的 依据 . 

如 今 特征 值 问题 早已 成 为 线性 代数 的 研究 重点 ,在 理论 和 应 用 上 都 非常 重要 . 理论 
上 ,矩阵 的 特征 值 就 是 线性 算 子 的 谱 , 因 此 可 从 泛 函 分 析 里 找到 理论 的 支撑 和 生长 点 . 
应 用 上 ,结构 动力 分 析 、 信 号 处 理 、 图 像 处 理 、 模 式 识别 等 学 科 中 经 常 需要 求解 特征 值 问 
题 ,Google 的 PageRank 算法 更 是 成 了 最 有 价值 的 应 用 . 另外 ,微分 方程 中 的 许多 问题 都 
可 以 转化 为 矩阵 特征 值 问题 . 


7.1 特征 值 的 估计 


由 于 工程 计算 中 求 矩 阵 尤其 是 高 阶 和 矩阵 的 精确 特征 值 通常 比较 困难 , 而 许多 情况 下 
我 们 只 需要 知道 特征 值 在 什么 范围 内 变化 或 者 落 在 什么 区 域内 ,例如 判断 方 阵 的 宕 级 数 
是 否 收敛 只 要 看 方 阵 的 特征 值 的 模 或 谱 半 径 是 否 小 于 1, 因 此 特征 值 的 估计 就 显得 尤其 
必要 ,这 方面 的 理论 在 特征 值 问题 中 相当 经 典 . 
7.1.1 从 特征 值 问 题 的 稳定 性 说 起 
工程 计算 中 ,求解 特征 值 问题 
4x 一 Mx 
的 特征 对 (4,x) 时 ,由 于 数据 往往 带 有 误差 ,因此 我 们 计算 出 的 特征 对 (4,x), 一 般 与 
(4,x) 不 相同 ,但 可 以 看 成 是 将 矩阵 4 扰动 成 4 之 后 的 特征 值 问题 
Ax = Ax 
的 解 ,其 中 扰动 为 E 二 4 一 A = (e;). 正如 第 1 章 已 指出 的 ,这 种 研究 思路 就 是 向 后 误差 
分 析 法 . 
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最 理想 的 状态 当然 是 扰动 也 对 特征 对 (4,x) 影响 不 大 , 即 相 应 的 特征 值 问 题 Ax = 
hx 是 稳定 的 . 进一步 地 ,我 们 还 希望 知道 矩阵 元 素 尤其 是 特定 位 置 的 矩阵 元 素 的 变化 对 
特征 对 的 影响 . 由 于 一 般 只 知道 | | 或 | 五 | 的 某 个 上 界 , 因 此 有 必要 研究 如 何 利用 这 样 
的 上 界 , 以 尽 可 能 准确 地 估计 4 与 4 以 及 x 与 x 之 间 的 差距 ,从 而 可 确定 特征 值 问题 的 稳 
定性 . 
由 于 和 矩阵 特征 多 项 式 的 系数 是 矩阵 元 素 的 连续 函数 ,而 特征 多 项 式 的 根 又 都 是 其 系 
数 的 连续 函数 ,因此 和 抢 阵 的 特征 值 作 为 特征 多 项 式 的 零点 都 连续 地 依赖 于 矩阵 的 元 素 . 
这 就 意味 着 矩阵 元 素 连续 变化 必然 导致 对 应 特征 值 的 连续 变化 . 
奥 斯 特 洛斯 基 (Ostrowski)1957 年 给 出 了 特征 值 的 这 种 连续 性 的 定量 分 析 , 结果 
如 下 : 
定理 7.1.1 设 矩 阵 4 王 《az ) wn 1B = (bs ) xn 的 特征 值 分 别 为 Ais pi (i = 1,2,°°, 
n). 令 
三 (十 2 。 [max( |as | ,bbs | ) J 。 (二 1 一 Al。 由 (7. 1. 1) 
则 :(1) 对 4 的 任意 特征 值 M， 存在 (未 必 唯 一 ) B 的 特征 值 yj, 使 得 |4; 一 j | 二 6; 
《2) 存 在 1,…, 的 排列 (1),… ,n(n)，, 使 得 |4; 一 jx | 二 (22 一 1)0. 
证 明 : 请 参见 文献 [40]. 
定理 外 说 明 , 当 B—A 时 ,存在 1,°%*,n 的 一 个 固定 的 排列 Ty 使 得 jx， 一 Ai 因 
此 矩阵 的 特征 值 连续 地 依赖 于 矩阵 元 素 . 
遗憾 的 是 ,矩阵 的 特征 向 量 一 般 不 是 矩阵 元 素 的 连续 函数 ,因此 不 一 定 是 稳定 的 . 请 
看 下 例 . 


1 0 0 
例 7.1.1 函数 矩阵 4(e) 二 |0 1 十 e 1 | 的 特征 值 为 1 十 e (二 重 ) 和 1, 特征 
E 0 1 十 s 


向 量 为 (0,1,0)” 和 (1,1/e, 一 1)'. 而 矩阵 4(0) 的 特征 值 为 1 (三 重 ), 特征 向 量 为 
(0,1,0)T 和 (1,0,0)T. 显然 , 当 e->0 时 (1,1/e, 一 1)7-> (1,0,0)7 不 成 立 , 因 此 函数 矩 
阵 A(e) 的 特征 向 量 在 e = 0 处 不 连续 . 
7.1.2 盖 尔 定理 

把 矩阵 4 分裂 成 4 王 了 二 了 B, 其 中 DD= diag(a1l,…,am)，, 构造 4 的 扰动 矩阵 4(e) = 
D 十 eB, 显然, 4(0) = D, A(1) 一 4. 

我 们 有 理由 猜测 ,如果 s 足 够 小 ,函数 矩阵 4(e) 的 特征 值 将 位 于 矩阵 4(0) 的 特征 值 
( 即 4 的 对 角 元 au az，…an ) 的 某 些小 邻 域内 . 盖 尔 圆 就 是 刻画 这 些小 邻 域 的 一 种 
方式 . 

定义 7.1.1 对 方 阵 A 二 (aj) E€ C™, 称 


{z€E Cllz—al<R)} (= 1,.%,n) (C7. 1 区 


为 矩阵 4 的 行 盖 尔 (Gerschgorin) 圆 , 记 为 G;(4), 并 称 并 集 U Gi(A) 为 矩阵 A 的 行 盖 尔 
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区 域 ,其 中 R; = 二 2》，|a; |. 类 似 地 ,可 定义 矩阵 4 的 列 盖 尔 圆 和 行 盖 尔 区 域 . 

按 前 述 思想 ,矩阵 特征 值 应 该 位 于 盖 尔 圆 之 内 ,此 即 下 述 盖 尔 定理 . 

定理 7. 1. 2 (Gerschgorin) 对 方 阵 A 二 (ay )w EC, 成立: 

(1) 和 矩阵 4 的 特征 值 都 位 于 其 行 盖 尔 区 域内 ; 

(2) 若 矩阵 4 的 所 有 行 盖 尔 圆 中 ,有 m 个 行 盖 尔 圆 构 成 的 并 集 G 是 连通 区 域 ( 即 区 域 
内 任何 两 点 都 可 以 用 区 域内 的 折线 段 连接 起 来 ), 并 且 与 其 余 nn 一 m 个 行 羡 尔 圆 均 不 相 
交 , 则 G 中 恰好 有 4 的 m 个 特征 值 . 

证 明 :(1) 设 4 有 特征 对 (4,x), 这 里 x 王 (zyzz，……z)T， 则 


OA 一 AZj (=1,%,n) 
k=1 


令 | 考 | = max| zo | , 则 |z| 关 0 (否则 x 为 零 向 量 ,与 x 是 特征 向 量 相 蔬 盾 ), 因 此 
[2—apl* |zsl= | 9) agzi|< > lanl: lz 
k=1,kzp k=1,k#p 


过 [se > [ax|= | [R'; 
k 


0 
从 而 |4 一 ayp [| 志 RR 
《2) 假 设 4 的 前 m 个 行 盖 尔 圆 构成 连通 区 域 C, 且 与 后 一 m 个 盖 尔 圆 分 离 . 由 (1) 
可 知 
oA(e)) CU Gi(Ale)) 
并 且 


Gi(A(e)) CG(A), GMO0)) = GD 一 ai G4(1)) = Gh) (= 1,.…,n) 
(2. 1.8) 


根据 定理 7. 1. 1, 显 然 A(e) 的 每 个 特征 值 2;(e) 都 连续 地 依赖 于 sE [0,1], 因此 , 当 
e 从 0 变化 到 1 时 ,每 个 Xi(e) 表示 了 C 中 的 一 条 始点 为 4;(0) = a; 终点 为 A;(1) 一 和 ;的 
连续 曲线 . 而 且 当 8 连续 变化 时 , A(e) 的 前 m 个 行 盖 尔 圆 始 终 与 后 n 一 mm 个 行 羡 尔 圆 分 
离 . 因此 ， 以 Q11 9 C22 9 "°°" Um 为 始点 的 m 条 连续 曲线 和 (e) »A2 (e) 9°"*,Am(E) 全 部 位 于 此 时 
的 G 二 U Gi(A) 之 中 ,所 以 它们 的 终点 Ni ,zw 也 位 于 G 之 中 . 同 理 可 证 , G 中 不 合 
剩余 的 连续 曲线 ArHl (e) Amt2 (€) syAn(e), 因此 也 不 含 它 们 的 终点 Amti yAmi2 Ah。 
证 毕 . 

注意 : 盖 尔 定理 并 没有 明确 指明 每 个 行 盖 尔 圆 内 一 定 有 且 仅 有 一 个 特征 值 . 另外 , 因 
为 转 置 矩阵 不 改变 特征 值 , 所 以 盖 尔 定理 对 列 盖 尔 圆 也 同样 成 立 . 

ATLAST 程序 包 中 提供 了 函数 gersch, 可 用 于 绘制 盖 尔 圆 ,其 调用 格式 为 


gersch (A,eigplot, color) 


其 中 ,后 两 个 参数 可 以 使 用 缺 省 值 . 
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20 5 0.8 
4 10 1 
1 2 Jo 


例 7.1.2 和 矩阵 A = 的 三 个 行 盖 尔 圆 分 别 是 (如 图 7- 1 所 示 ): 


Gi(AM)= {z€E Cl||z—20|<5.8} 
GMA)= {z €E Cl||z—10|<5} 
Gi(A)= {xz€ C||z—10i|<3} 


图 7-1 三 个 盖 尔 圆 图 7-2 隔离 后 的 盖 尔 圆 


在 图 7-1 中 ,注意 到 Gi(A) 与 Gu(4) 有 重奏 ,而 我 们 希望 每 个 盖 尔 圆 内 有 唯一 的 特 
征 值 ,因此 必须 收缩 这 两 个 盖 尔 圆 的 半径 . 这 种 收缩 最 好 不 要 改变 考 矩 阵 的 特征 值 ,因此 
可 考虑 相似 变换 . 在 文献 [87] 中 , 威 尔 金森 指出 ,为 了 得 到 特征 值 的 更 加 准确 的 估计 ,可 
以 通过 相似 变换 矩阵 D, 将 矩阵 A 相似 变换 为 矩阵 B 二 DAD- , 以 缩小 盖 尔 圆 的 半径 ， 
达到 隔离 盖 尔 圆 的 目的 ,如 图 7 - 2 所 示 . 实际 中 为 计算 方便 ,常常 取 DD 为 对 角 和 矩阵 . 当然 
威 尔 金森 当初 的 做 法 ,是 先 将 矩阵 变换 成 Jordan 标准 型 ,再 用 盖 尔 定理 和 对 角 相似 变换 ， 
对 不 同 特征 值 结构 的 特征 值 问题 进行 了 细致 的 扰动 分 析 . 

设 A== (ay)w 且 D = diag(di,d,,…,d,) 的 元 素 全 为 正 数 ,其 中 d; 取 1 且 剩余 的 d 
= 1, j 关 i, 则 算 阵 B 二 DAD- (注意 不 是 B 一 D1AD ) 的 个 行 盖 尔 圆 半径 为 


> =d > lal = dR (7.1.4) 
j=1 zt J j= jt j 
六 总 dal _ 和 加 . 
R= 2 oF l=4d 2 lmls =R+G -Dal =1,2,mkz) 
FT 了 j= 7 i 


(7. 1.5) 


由 式 (7. 1.4) 和 式 (7. 1.5) 可 知 , 当 4d; 二 1 时 ,A 的 第 i 个 行 盖 尔 圆 半径 缩小 ,同时 ， 
其 余 的 n 一 1 个 行 盖 尔 圆 半径 都 增 大 ; 当 d; 二 1 时, A 的 第 i 个 行 盖 尔 圆 半径 增 大 ,同时 ， 
其 余 的 2” 一 1 个 行 盖 尔 圆 半径 都 缩小 . 故 对 图 7 -1 而 言 ,应 增 大 G;(4) 的 半径 ,这 样 就 能 
缩小 G1(4) 与 G; (4A) 的 半径 . 
20 5 0.8 
4 10 1 
i 


例 7.1.3 和 矩阵 A = 经 过 对 角 相 似 变 换 D = diag(1,1,2. 5) 后 ,得 
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20 9 432 
B=DAD"*=|4 10 0.4 
2.8 5 10 


A 的 三 个 行 盖 尔 圆 分 别 收 缩 为 (图 7- 2): 
GB)= {z € C||z—20 |<5.32) 
Gz: (B)= {z€ C||z—10|<4.4} 
Gis (B)= {xz€ C||z—10i|<7.5) 
盖 尔 圆 显 然 让 我 们 联想 到 行 对 角 占 优 和 矩阵 . 事实 上 , 盖 尔 定理 与 对 角 占 优 矩 阵 确实 
有 着 密切 关系 . 我 们 在 定理 6. 2. 4 中 已 经 证 明 命 题 “ 严 格 对 角 占 优 和 矩阵 都 是 可 逆 和 矩阵 ”是 
正确 的 , 故 当 A 是 严格 对 角 占 优 和 矩阵 时 , 4 没有 零 特 征 值 ,而 且 满 足 
|0—a;|= |a; | R, G= 1,2,.%,n) 
这 说 明和 矩阵 4 的 特征 值 应 该 满足 
| 一 好 | 委 RR (= 1,2,.,n) 
由 此 ,我 们 可 以 将 盖 尔 定理 看 成 上 述 命题 的 “推论 ”. 
事实 上 , 若 矩 阵 4 的 某 个 特征 值 4 不 属于 A 的 盖 尔 区 域 , 则 有 
[4—ai|> R: (Gi= 1,2,.",n) 


因此 ,矩阵 这 一 4 是 严格 对 角 占 优 的 ,根据 上 述 命题 , det(XI 一 A) 关 0, 这 显然 与 4 是 
A 的 特征 值 相 矛盾 . 

仅仅 对 矩 阵 元 素 进行 简单 的 算术 运算 ,就 能 够 估计 和 抢 阵 的 特征 值 , 盖 尔 定理 的 这 种 
简洁 性 和 优美 性 吸引 了 许多 数学 家 ,从 而 催生 了 数 百 篇 相关 论文 . 给 出 盖 尔 定理 这 个 强 
大 工具 的 ,就 是 苏联 数学 家 盖 尔 (Semyon Aranovich Gerschgorin, 见 图 7- 3). 


图 7-3 盖 尔 (1900 一 1931) 


图 7-4 Cassini 卵 形 


盖 尔 1923 年 起 就 读 于 彼得 格 勒 技术 学 院 力 学 系 ,期 间 发 表 多 篇 论文 ,涉及 弹性 理 
论 \ 振 动 理论 ,微分 方程 的 近似 数值 积分 法 等 领域 ,因此 他 1930 就 被 聘 为 列宁 格 勒 机 械 
工程 学 院 教授 . 1931 年 ,他 发 表 “ 关 于 矩阵 特征 值 的 极限 ”( 德 文 版 ) 一文 ,给 出 了 盖 尔 定 
理 .然而 ,高 强度 和 高 压力 的 工作 使 得 他 的 身体 极度 虚弱 , 当年 竟 突 发 重病 请 然 辞世 ,年 
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仅 31 岁 . 

盖 尔 圆 也 激励 了 布 劳 尔 (Alfred Brauer). 作为 盖 尔 定理 的 推广 ,他 于 1947 年 发 现 优 
美的 Cassini 卵 形 (如 图 7- 4 所 示 ) 也 可 以 用 于 估计 特征 值 

定理 7.1.3 (Brauer) 方 阵 A 一 (ai )wo E Ce 的 任意 特征 值 都 位 于 2 二 了 个 


分 
Cassini 卵 形 (oval) 的 并 集 B 内 , 即 


i€B= U, {z€ Cllz-al|z—a; |<RR,) (7.1.6) 

证 明 :定理 的 证 明 与 盖 尔 定理 类 似 , 区 别 仅 在 于 要 选择 两 个 最 大 模 分 量 . 

设 A 有 特征 对 4,x), 这 里 x 二 (zyza…z)T, 令 |z| 一 max | Zz | , 则 z, 关 0. 
如 果 x 的 其 他 分 量 都 是 零 , 则 由 A4x 二 ix 可 知 ao 二 4, 由 于 此 时 aw € B, 因此 A 的 特征 
值 XE 了 B. 

如 果 x 至 少 有 两 个 非 零 分 量 , 不 妨 设 第 二 个 绝对 值 最 大 的 分 量 为 x,, 则 由 Ax = Ax 
可 知 


2Zp (一 Qtp) = > amTk 


k=1,kAp 
从 而 
1 一 二 六 | 一 | Dagn | 2 lol Imbelal 3 lagl|= [wR 
k=1,kzp k=1,kAp k=1,hp 
此 即 
[4—aw lB et 《7. 1.7) 
[ey | 
同 理 可 知 
Ee C7. 1,8) 
[z | 


因此 ,由 式 (7.1.7) 与 式 (7.1.8) 可 知 |4 一 ay ||4 一 aw | 三 RR,, 即 和 EB. 证 毕 . 
7.1.3 特征 值 的 界 

最 后 ,我 们 再 给 出 一 些 估计 特征 值 上 界 的 方法 . 

首先 ,根据 矩阵 4 的 Cartesian 分 解 ,有 A 一 B+C, 这 里 B 一 去 (4 十 4m) 是 Hermite 


和 矩阵 , C= 去 (4 一 A) 是 反 Hermite 矩阵 . 众所周知, 如果 C= O00, 则 A 是 Hermite 和 矩阵， 


特征 值 全 为 实数 . 当 C 的 元 素 在 0 附近 变化 时 , 4 的 特征 值 会 出 现 复数 ,因此 矩阵 C 可 用 
于 确定 和 矩阵 A 的 特征 值 虚 部 的 变化 范围 

定理 7.1.4 (Schur) 设 AE Co 的 特征 值 为 A1 ,Xz，… ,14,. B,C 同 前 , 则 

GD) | 十 … 十 [1.1? 过 141 ; 
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(2) | ReCui | 十 … 十 |Re(.)|? 过 1Blz; 

(3) | ImGa)|12 十 … 十 |ImGs)|1 :入 | Cl. 
并 且 , 当 且 仅 当 4 是 正规 矩阵 时 ,等 号 成 立 . 

证 明 :(1) 设 4 的 Schur 分 解 为 4 王 DUTUE , 其 中 上 三 角 阵 T== (4 ),w 的 主 对 角 元 显 
然 就 是 矩阵 4 的 特征 值 ,于 是 根据 下 范 数 的 西 不 变性 ,有 


Ial: = lvrosls = |TI = 2 4+ Di DIA? 
i=] r=s i=] 
(2) 由 于 B 二 三 DT 十 TH) UH, 因此 


lier -ol 
1B|#= | $er+ | = 之 Fi th) 


= DIReQ)1 + |’ > |ReQ)? 
i=1 rs i=] 


(3) 的 证 明 与 (2) 类 似 , 留 作 练习 . 

在 上 述 证 明 中 , 当 且 仅 当 A 是 正规 矩阵 时 ,上 三 角 阵 TT 为 对 角 和 矩阵 , 即 i = 0 (7 二 3)， 
因此 等 号 都 成 立 . 证 毕 . 

推论 7.1.1 (Hirsch) 对 A € C”™ 的 任意 特征 值 M), 有 

(1) |4|<n: max, | |; 

(2) | Re(0) | 可 。 Max, | as 二 ai|; 


(3) |ImGQ)| 委 六 。 ,max, | ay 十 ai|. 


证 明 : (1) |4|? 过 2)14|? = |Al$ = > laysl: < “ Cmax | 0 |22 结论 
a = 他: 


得 证 . 
其 余 的 请 读者 自己 动手 试 试 . 证 毕 
20 5 08 
例 7.1.4 和 矩阵 4 一 | 4 10 按 推论 7. 1. 1 所 得 特征 值 的 变化 范围 为 带 型 
2 10i 
区 域 : 


{z| | z| 委 60)  {z|| Re(z) |< 60, |Im(z)|< 30) 
与 前 两 例 相 比 ,这 个 结果 比 相应 的 盖 尔 圆 大 得 多 ,因此 这 种 估计 方法 比 盖 尔 定理 差 . 


7.2 多 项 式 特征 值 问题 


标准 特征 值 问题 (standard eigenvalue problem,SEP) : 
Ax = Ax 
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可 变形 为 
SG)x 王 (一 4 十 MT)x 一 0 

其 中 , SQ) 三 一人 4 十 订 为 4 矩阵 ,其 对 角 元 是 关于 4 的 一 次 多 项 式 , 并 且 一 次 项 系数 都 为 1. 

按 此 视角 ,广义 特征 值 问 题 (generalized eigenproblem,GEP): 

Ax = ABx 
即 为 
GCC)X 三 (一 4 十 )z)x 一 0 

其 中 ,1 和 矩阵 GG) = 一 和 A 十 2B 的 元 素 是 关于 ) 的 一 次 多 项 式 , 并 且 当 下 = 工时 GEP 退化 
为 SEP. 

遵循 历史 习惯 ,我 们 称 4 和 矩阵 A 一 XB 为 矩阵 束 (matrix pencil) , 记 作 (4,B), 因为 当 
4 变动 时 ,一 系列 矩阵 4 一 XB 在 矩阵 空间 里 形成 了 “直线 ”, 仿 佛光 束 或 铅笔 (pencil). 

类 似 地 ,我 们 有 二 次 特征 值 问 题 (quadratic eigenproblem，, QEP): 

QOx = AM+AIC+Rx=0 

这 里 ,) 和 矩阵 QGQ) 为 4 的 二 次 矩阵 多 项 式 ,其 元 素 都 是 关于 4 的 二 次 多 项 式 . 

推广 到 4 的 三 次 矩阵 多 项 式 , 则 有 三 次 特征 值 问题 (cubic eigenproblem,CEP): 

C(x (OA, 十 124， 十 AA1 趟 四 0 元 一 0 

更 一 般 地 ,推广 到 4 的 7 次 矩阵 多 项 式 , 可 得 多 项 式 特 征 值 问题 (polynomial eigen- 

problem, PEP): 
P(X 二 (MAA 十 十 A441 十 40) 式 一 0 

显然 , 当 /= 二 2,3 时 PEP 分 别 退 化 为 QEP 和 CEP. 


如 果 进 一 步 将 4 和 矩阵 的 元 素 推广 为 非 线 性 函数 ,我 们 就 有 了 非 线 性 特征 值 问 题 (non- 
linear eigenproblem, NEP): 


TCDOx 一 0 


这 里 , T() 的 元 素 是 关于 4 的 非 线性 函数 . 

由 于 二 次 多 项 式 已 经 不 是 线性 函数 ,因此 一 般 将 QEP、CEP 等 PEP 看 成 特殊 的 
NEP, 也 就 是 说 ,QEP 是 最 特殊 的 NEP. 在 当前 的 NEP 研究 中 ,PEP 是 热点 . 此 外 ,对 一 
般 意义 下 的 NEP, 目 前 的 主要 算法 基于 的 都 是 求解 非 线性 方程 组 的 Newton 法 及 其 变 
体 ,理论 和 算法 都 不 成 熟 . 


7.2.1 广义 特征 值 问题 


在 GEP 中 ,我 们 称 Ax = XBx 为 广义 特征 方程 (generalized characteristic equation ) ， 
称 pp) = | 和 2 一 4| 为 广义 特征 多 项 式 (generalized characteristic polynomial) ,并 称 满 
足 4x 二 XBx 的 复数 4 为 广义 特征 值 (generalized eigenvalue) , 记 为 1 (4,B) 或 简 记 为 ). 
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显然 , p02) 的 次 数 4 过 nn, 其 根 4 称 为 矩阵 束 (4,B) 的 有 限 特 征 值 . 当 & 二 nn 时 , 甜 
阵 束 (4,B) 有 nn 一 4 个 无 穷 特征 值 . 例如 A 二 diag(1,1,0),B 二 diag(2,0,1) 时 ,矩阵 束 
(4,B) 的 特征 值 为 0.5,0 和 ox. 

当 是 有 限 特征 值 时 ,我 们 称 满足 Ax = XBx 的 非 零 向 量 x 为 特征 值 的 ( 右 ) 广 闵 特 
征 向 量 (right generalized eigenvector), 称 (4A,x) 为 广义 特征 对 (generalized eigenpair)， 
称 满足 yn4 二 Ay B 的 非 零 向 量 y 为 特征 值 的 ( 左 ) 广 义 特 征 向 量 (left generalized eig- 
envector) , 称 (M,x*,y) 为 GEP 的 特征 三 元 组 (eigentriple). 特别 要 注意 ,不 要 将 这 里 定义 
的 广义 特征 向 量 与 Jordan 标准 型 中 出 现 的 广义 特征 向 量 相 混淆. 

当 》) 是 无 穷 特征 值 时 , 称 满足 Bx == 0 的 非 零 向 量 x 为 特征 值 的 ( 右 ) 广 义 特征 向 
量 , 称 满足 ?了 = 0 的 非 零 向 量 y 为 特征 值 的 ( 左 ) 广 义 特征 向 量 . 

同 SEP 的 情形 类 似 ,GEP 也 未 必 存 在 ?个 线性 无 关 的 特征 向 量 , 即 可 能 存在 亏损 特 
征 值 . 特征 值 是 亏损 的 ,或 者 特征 值 是 复数 , 当初 在 SEP 中 就 极 大 地 增加 了 问题 的 难度 ， 
更 何况 GEP 中 还 可 能 会 出 现 无 穷 特征 值 . 这 些 情况 的 存在 ,无 论 是 理论 上 还 是 算法 上 ， 
都 极 大 地 增加 了 GEP 的 复杂 程度 . 

同 SEP 类 似 ,GEP 也 存在 等 价 变换 . 设 头 ,Y 是 可 道 和 矩阵 , 则 和 矩阵 束 (4,B) 可 通过 等 
价 变换 X,Y 转化 成 矩阵 束 (A, BB), 这 里 A 二 YHAX, 记 一 YHBX. 显然 (A,B) 与 (4,B) 
的 特征 值 相同 ,并 且 (A, 入) 的 相应 特征 向 量 是 和 一 Xx,》 二 YT1y. 

无 论 是 理论 上 还 是 实际 中 ,经 常 要 处 理 的 是 正定 矩阵 束 (definite matrix pencil) 
(4,B) 的 特征 值 问题 ,这 里 4" 一 4,B8 一 妆 且 过 0. 显然 ,此 时 p(X) 的 次 数 & 一” 因 
此 (4,B) 没有 无 穷 特征 值 ,而 且 (4,B) 的 广义 特征 值 全 为 实数 , 故 可 对 这 些 特征 值 进行 
排序 .事实 上 ,由 于 B 放 0, 故 存在 可 逆 和 矩阵 O, 使 得 B= 二 0"Q, 因此 CT 40O 7 'Qx 一 4Qx. 
记 S$S 一 Q 40O 1",y 一 Qx, 即 得 Sy 二 Ny. 由 于 S" 二 5S, 故 4 都 是 实数 . 

同时 ,对 Ax == XBx 两 边 共 斩 转 置 ,可 得 xa4 二 A4xB, 即 x 也 是 特征 值 的 左 广义 特 
征 向 量 . 特别 地 , 当 4,B 都 是 实 和 矩阵 时 ,特征 值 * 对 应 的 x 也 是 实 向 量 . 同 SEP 类 似 , 我 
们 也 可 以 适当 选取 这 些 x, 使 得 (x; ,x;)s 二 xFBx; 二 6;， 即 它们 关于 正定 Hermite 矩阵 
B 正 交 . 因此 正定 矩阵 束 (4 ,B) 的 特征 对 G; ,xi) 满足 


Ax; = ABx;, xiBx; =6; (i,j = 1,2,.…,n) G1: 1 
也 就 是 

xHAx; = A6;, xiBx; =6; (i,j = 1,2,.%,n) 
这 说 明 广 义 特征 向 量 对 和 矩 阵 A 加 权 正 交 , 即 (xi,x)4 二 0G 天 力 且 人) 一 NG 一 力 ,对 


和 矩阵 B 不 仪 加 权 正 交 , 而 且 模 已 规范 化 ， 即 (x so )p=00 六 站 其 (Kisk)s = 1 (= js 
车 记 关 二 (oo 和 一 (zs), 则 式 (7.2.1) 也 可 写成 


AX = BXA, X"BX 一 工 (72.2. 2 


另外 ,由 于 X19X2 "TX 两 两 B 正 交 ， 因此 它们 也 可 以 看 成 CG” 的 一 组 基 , 此 时 对 任 
意 xE C", 显然 有 如 下 的 展开 定理 : 


| 十 azx2 十 Se 十 QnXn 
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其 中 的 系数 


ti = (ss 2 


对 正定 矩阵 束 (4,B), 等 价 变 换 也 特殊 为 合同 变换 , 即 可 令 A 二 XHAX, B= X"BX. 

这 显然 相当 于 Y = X 的 情形 . 由 于 A, 各 仍然 是 Hermite 矩阵 ,并 且 名 还 是 正定 的 ,因此 
(A,B) 仍然 是 正定 矩阵 束 . 特别 地 ,由 式 (7. 2. 2) 可 知 , AX = XA, 即 

XHAX = A, XBX 一 了 (7. 2. 3) 


这 就 是 说 正定 矩阵 束 (4,B) 与 正定 矩阵 束 (A,D 是 合同 的 , 即 两 矩阵 4,B 可 同时 合同 
对 角 化 . 
实际 上 , 式 (7. 2. 3) 中 实现 同时 合同 对 角 化 的 矩阵 X 可 放宽 为 可 逆 和 矩阵 ， 
例 7.2.1 《〈 同 时 合同 对 角 化 ) 对 正定 矩阵 束 (4,B) 的 特征 值 问 题 ,存在 可 逆 和 矩阵 
卫 , 使 得 
PH4P 一 人 ，PHBP 一 工 


这 里 , A 三 diagGi,)，…) 的 对 角 元 都 是 实数 , 且 都 是 广义 特征 值 . 

证 明 : 由 于 如 二 0, 所 以 存在 可 逆 和 矩阵 Pi, 使 得 P7'BP, = 二 I 又 4" 二 A, 因此 
(PHAP,) 二 PHAP 一 PPTAP ,此 即 PEAP, 也 是 Hermite 和 矩阵 , 故 PHEAP, 西 相似 于 对 
角 阵 , 即 存在 本 矩阵 U 及 实 对 角 阵 A 3 diag(Ai 2 Am) 使 得 UPiAPIU 一 A. 令 
P= 二 PU, 则 P 可逆 ,并 且 

PHAP = UPrAPIU 一 人 ,PHEBP = UPHBPIUVU 一 UHEU 一 工 


另外 ,由 第 二 式 可 得 Pn = C(BP) ,代入 第 一 式 , 得 4=PI4P 王 PIBI4P, 这 说 明 
), 是 BA 的 特征 值 , 因 此 也 是 广义 特征 值 问题 Ax = MBx 的 特征 值 . 证 毕 . 

对 于 大 型 稀 跑 矩阵 A,B 的 GEP, 当 仁 不 让 的 仍然 是 投影 类 方法 . 这 是 一 片 浩瀚 的 海 
洋 . 限于 篇 幅 , 本 书 略 去 不 谈 . 至 于 稠密 或 低 阶 和 矩阵 A,B 的 GEP, 理 论 上 可 采用 等 价 变换 
将 GEP 转化 为 SEP, 同 时 保持 变换 前 后 的 特征 向 量 相 同 或 存在 线性 关系 . 进而 通过 求解 
SEP, 解 出 变换 前 的 GEP. 这 类 方法 可 统称 为 谱 变 换 (spectral transformation) 方 法 . 下 面 
我 们 对 之 进行 深入 分 析 . 

1.Cholesky 分 解法 

对 正定 矩阵 束 (4,B) 的 特征 值 问题 ,由 于 如 二 0, 故 有 Cholesky 分 解 B = 二 ILN, 从 
而 Ax = ALLYx, yA Ee Ay"IL™, 即 

(ray = ML Lg A = (Ty) 
令 A=LL'AL ,x 二 Ltix,y 二 Liy, 则 得 
Ax =Ax,yiA 一 My C 

显然 ,算出 4 的 特征 三 元 组 4,x,y) 后 ,就 可 得 到 原 GEP 的 广义 特征 三 元 组 (AM, LaX， 
Ly). 

值得 欣喜 的 是 ,矩阵 4 仍然 是 Hermite 矩阵 ,因此 Cholesky 分 解法 是 一 种 保 结构 算 
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法 . 但 Cholesky 分 解法 要 求 和 矩阵 束 (4,B) 是 正则 的 ,这 却 极 大 地 限定 了 它 的 适用 范围 . 
另外 ,尽管 工 是 单位 下 三 角 和 矩阵 ,但 4 却 未 必 是 稀 朴 的 ,这 使 得 我 们 在 处 理 相应 的 SEP 
时 ,似乎 享受 不 到 三 角 分 解 的 好 处 ， 当然 ,在 实际 问题 中 ,我 们 一 般 不 会 直接 求 矩 阵 4, 而 
是 代 之 以 计算 诸如 r = Ag 这 样 的 矩阵 向 量 积 . 
2. 直接 求 逆 法 
当 和 矩阵 BB 可 逆 时 ,显然 广义 特征 值 问 题 
Ax =ABx, yA=AyB 


等 价 于 下 面 的 标准 特征 值 问题 : 

(BT4)x 一 Mx，yHCB-4) 一 1yH (7. 2. 5) 
其 中 , y = Bay， 或 者 等 价 于 

(ABT')x =Ax, yi(AB 1!) 一 和 yH (7. 2. 6) 
其 中 ， x 一 Bx. 


直接 求 逆 法 的 优点 是 特征 向 量 不 变 或 存在 线性 关系 ,但 缺点 是 矩阵 B 奇异 时 不 能 使 
用 ,并 且 当 和 矩阵 8B 二 0 时 ,和 矩阵 Ti 二 BA 或 Ti 二 AB 一 般 不 再 是 对 称 和 矩阵 , 即 直 接 求 首 
法 不 是 保 结构 的 算法 ,这 就 使 得 相应 SEP 的 计算 变 得 十 分 复杂 . 

3. 位 移 求 逆 法 

当 矩 阵 A,B 都 是 奇异 的 ,或 者 矩阵 B 是 病态 矩阵 时 ,显然 无 法 使 用 式 (7. 2. 4)、 式 
(7.2.5) 或 式 (7.2.6), 此 时 一 种 常见 的 处 理 方式 是 通过 适当 选择 位 移 (shift) 或 极点 
(pole) ww， 再 通过 直接 求 逆 法 ,将 之 转化 为 SEP: 


Tsx = tx, ziTs = rz 


这 里 , Ts 二 (4 一 jyB) 1B, rt 一 (4 一 yp) ,xz 一 (4 一 /8B)HEy 显然 ,算出 工 的 特征 三 元 组 
(t,x,z) 后 ,就 可 得 到 原 GEP 的 广义 特征 值 4 = jy 十 及 相应 的 广义 特征 向 量 x 和 y = 
(4A 一 xB Hz, 

位 移 求 逆 法 (shift-and-invert, SD) 的 优点 是 特征 向 量 不 变 或 存在 线性 关系 ,矩阵 B 奇 
异 时 也 可 以 使 用 ,并 且 在 求解 邻近 jy 的 特征 值 或 绝对 值 很 小 的 特征 值 时 效率 较 高 ,因为 
通过 特征 值 的 倒数 变换 ,原来 靠 得 很 近 的 特征 值 可 以 得 到 很 好 的 分 离 ;缺点 仍然 是 Ts 一 
般 不 是 特殊 矩阵 . 

4. Cayley 变换 法 

如 果 已 经 得 到 (4 一 4B)x 一 0 的 特征 值 4 的 近似 值 y 及 极点 ,那么 通过 Cayley 变换 

Tc = (4 —puB) (A— vB) 

可 以 将 之 转化 为 SEP: 


Tex= rx 


其 中 ,rz 一 QQ 一 0 一 当 ， 
证 明 : 由 Ax 二 XBx 可 知 (4 一 jyB)x 一 XBx 一 /Bx 二 (4 一 j/)Bx，, 因为 1 不 是 特征 值 ， 


。320 ， 矩阵 分 析 与 计算 


所 以 A 关上 且 A 一 1B 可 逆 , 从 而 (4 一 pB)-Bx == 一 /mx. 同时 ,由 于 
(A—1.B) QA—W Bxr= (A—1B) QBx—vBx) = (A—B) (Ax—vBx) 
= (A—.B) (A—vB)x 
从 而 可 得 (4 一 1B)71Q 一 让 Bx = 人 一 /0 一 四 xz, 此 即 Tex == zx. 证 毕 . 
显然 , Te 二 (4 一 jyB) "(4 一 yB+i+yB—wB)=I+(—v (A4—uB) B=I+ 
(pu—v) Ts， 因此 Cayley 变换 法 实质 上 仍然 是 位 移 求 逆 法 . 
例 7.2.2 求解 广义 特征 值 问题 Ax == XBx, 其 中 


| 18 2 
| ，B= | 
1 1 3 2 
解法 一 :直接 计算 法 . 
| pe 和 
14 一 妇 |= FE | 24)(4 一 16X2)，, 因此 广义 特征 值 为 入 一 二， 


和 一 子 . 再 分 别 解 齐 次 线性 方程 组 (4 一 A1B)x 二 0 和 (4 一 A2B)x 一 0, 可 得 对 应 的 广义 
特征 向 量 分 别 为 
Xi = C01) (有 天 0)， 和 一 已 (1 一 DT (ks #0) 


1 0 
Ti = BA 一 于 ( 。)， 的 特征 值 为 = 去, 一 于， 此 即 所 求 广义 特征 值 .再 


分 别 解 齐 次 线性 方程 组 (XA1 一 TD)x 一 0 和 Gz1 一 Ti)x 二 0, 可 得 对 应 的 广义 特征 向 量 分 
别 为 
Xl = ki (COs IY (ki 法 W's X2 = k;» (] ， 一 了 CR? 天 0) 
解法 三 :Cholesky 分 解法 . 


B 的 Cholesky 分 解 为 B 一 IL", 其 中 工 一 于 ,| 因此 = L774AL* = 
2 4 
1 2V2| ~ 
训 | 0 ?2 | ,二 的 特征 值 为) 一 广 ' 加 一 子 ， 此 即 所 求 广义 特征 值 .分 别 解 齐 次 线性 
2V2 17 4 


方程 组 (N41 一 A)x 一 0 和 (2T 一 4)x 二 0, 可 得 全 体 非 零 解 分 别 为 
x 一 2) (的 ; 二 二 多 (一 1) (六 00 
因此 As 所 对 应 的 广义 特征 向 量 分 别 为 


= 人 (0,18V2)' 一 局 (0,DT (ki 0) 


w= LH 二 (9 一 7 二 局 《1, 一 1)? 大 类 的 
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Matlab 中 的 内 置 函数 eig 也 可 用 于 计算 广义 特征 值 ,其 调用 格式 为 
[VD] = eig (A,B) 


返回 的 矩阵 了 和 对 角 阵 卫 满 足 4AVy = BVD, 因此 D 的 对 角 元 是 广义 特征 值 ,VY 的 列 向 
量 是 相应 的 广义 特征 向 量 . 
当 A 是 对 称 和 矩阵 且 B 是 对 称 正定 矩阵 时 ,可 使 用 调用 格式 


[V,D]= eig (A,B, 'chol') 


其 效果 与 前 面 的 调用 格式 等 价 . 显然 ,这 种 调用 格式 采用 的 是 Cholesky 分 解法 . 
另外 还 有 一 种 调用 格式 


[VD]= eig (A,B, 'qz') 


采用 的 是 QZ 算法 , 详 见 7. 4. 3 小节. 
对 于 广义 特征 值 的 计算 , Matlab 中 还 提供 了 更 加 灵活 的 内 置 函 数 eigs, 其 调用 格 
式 为 


eigs (A,B) ,eigs (A,B,k) 或 eigs (A,B,k, sigma) 


其 中 ,k 表示 返回 的 广义 特征 值 的 数目 ,而 sigma 的 取 值 则 比较 复杂 : 

(1) 当 A,B 都 是 对 称 和 矩阵 时 ,LM 或 SM 分 别 表示 返回 的 是 模 最 大 的 广义 特征 值 或 
模 最 小 的 广义 特征 值 , 值 LA 或 SA 分 别 表示 返回 的 是 最 大 的 广义 特征 值 或 最 小 的 广义 
特征 值 ,BE 则 表示 同时 返回 最 大 的 广义 特征 值 和 最 小 的 广义 特征 值 . 

(2) 当 A,B 不 是 对 称 矩 阵 或 4,B 是 复 和 矩阵 时 ,LR 或 SR 分 别 表示 返回 的 是 实 部 最 大 
的 广义 特征 值 或 实 部 最 小 的 广义 特征 值 ,LI 或 SI 分 别 表示 返回 的 是 虚 部 最 大 的 广义 特 
征 值 或 虚 部 最 小 的 广义 特征 值 . 

(3) 当 sigma 是 实数 或 纯 虚 数 时 ,返回 的 是 最 靠近 sigma 的 广义 特征 值 . 


7.2.2 二 次 特征 值 问 题 


QEP 作为 最 简单 的 NEP, 如今 正 受到 越 来 越 多 的 关注 ,因为 它 广泛 应 用 在 结构 动力 
分 析 \ 振 动 声学 、 多 输入 多 输出 系统 分 析 、 电 路 仿真 ,信号 处 理 \ 流 体力 学 有 限 元 分 析 、 约 
束 最 小 二 乘 问题 等 各 个 领域 . 例如 ,对 无 外 力作 用 但 具有 粘 滞 阻 尼 的 结构 系统 ,其 运动 方 
程 为 二 阶 微分 方程 


Mr 二 Cr 十 Kx 一 0. (3. 2. 2 


其 中 , M 表示 质量 矩阵 (mass matrix) ,满足 Mi = M 二 0; C 表 示 粘 性 阻尼 矩阵 (viscous 
damping matrix) ,满足 Ca 二 C; K 表示 刚度 矩阵 (stiffness matrix) ,满足 KH 一 K 计 0; 
向 量 x ,x ,x 分 别 表示 加 速度 、 速 度 和 位 移 . 将 通 解 x = e'u 代入 方程 (7. 2. 7), 即 得 特征 
方程 
(QAM+AC+Ru=0 
这 显然 就 是 一 个 二 次 特征 值 问 题 . 
抽 去 上 述 问题 的 物理 意义 ,并 放宽 对 矩阵 M,C,K 的 要 求 , 就 得 到 了 数学 上 的 二 次 特 
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征 值 问题 , 即 确定 标量 EC 和 非 零 向 量 x,y € C", 使 得 
CO)Oxz 一 0，yOW) 一 0 (7. 2. 8) 


其 中 , 0Q) = 二 XM 十 4C 十 K, 4 为 特征 值 ; x,y 分 别 为 对 应 的 右 特征 向 量 和 左 特征 向 量 . 

对 所 有 的 4 值 ,如 果 detOG) 圭 0 时 , 则 称 QQ) 是 正则 的 ,否则 就 是 非 正则 的 . 显然 
QQ) 的 特征 多 项 式 是 detQQ) 二 detCMD2” 十 低 次 项 ,所 以 当 M 非 奇异 时 , COGQ) 是 正则 
的 ,并 且 有 2n 个 有 限 特 征 值 . 但 当 M 奇 异 时 det@G) 的 次 数 * 志 22 此 时 CQGQ) 只 有 7 个 
有 限 特征 值 , 同 时 存在 2n 一 ”~ 个 无 穷 特 征 值 . 无 穷 特征 值 实际 上 对 应 的 是 道 多 项 式 
XQ) 一 12 玫 十 MC 十 M 的 零 特 征 值 . 另外 对 正则 的 CC) 而 言 , 相 异 特征 值 可 能 对 应 同 
一 个 特征 向 量 . QEP 与 SEP 和 GEP 的 一 个 主要 代数 区 别 在 于 :QEP 有 2n 个 特征 值 ( 有 
限 或 无 穷 大 ) ,最 多 2n 个 右 特征 向 量 及 最 多 2n 个 左 特征 向 量 . 这 就 意味 着 ,如 果 有 个 以 
上 的 特征 向 量 , 它 们 显然 构成 了 一 个 线性 相关 集 . 

例 7.2.3 求解 二 次 特征 值 问题 Q(X)x 二 0, 其 中 


0 6 0 1 一 6 9 1] 0 0 


0 0 1 0 0 0 0 0 1 
1) 十 1 612 一 6 0 
解 :显然 OOQ) 二 | 2 6x 一 74 十 1 0 | , 而且 QQ) 是 正则 的 ,因为 
0 0 12 十 1 


detQ() = 一 645 十 11X 一 1213 十 1212 一 A 十 1 圭 0 
解 特征 方程 detQ() 二 0, 得 5 个 有 限 特征 值 为 


入 一干， 一方 ， Ma 一 1，A4 一 21，)15 一 一 工 


接着 依次 解 齐 次 方程 组 Q(X4)x = 二 0 (二 1,2,…,5 ), 可 得 相应 的 特征 向 量 分 别 为 
i 一 (1,1,0)T ,x = (ch i WL == (O01 OT say = CO Os LY we 3 C(O OrL 


显然 ,第 6 个 特征 值 Ms 二 %, 此 时 解 齐 次 方程 组 (0?K 十 0C 十 MDx 二 0, 即 得 xs 一 
CL; O50T, 

可 以 看 出 ,尽管 1 天 1， 可 是 却 有 2 二 xz. 另外 ,As 对 应 的 特征 向 量 也 相同 . 这 
样 剩 下 4 个 不 同 的 特征 向 量 xi ,xs ,xy,xs, 它们 的 一 个 极 大 无 关 组 为 x1 ,x; ,x4，, 其 中 的 向 
量 个 数 正好 是 n 二 3. 事实 上 ,可 以 证 明 , 如 果 正 则 的 QQ) 有 2 个 两 两 不 等 的 特征 值 , 那 
么 它 必 有 个 线性 无 关 的 特征 向 量 组 ,正好 可 以 构成 C” 的 一 组 基 . 这 显然 是 对 SEP 和 
GEP 中 的 相关 结论 所 做 的 重要 推广 . 

Matlab 中 没有 专门 为 QEP 提供 内 置 函 数 ,但 其 中 用 于 求解 PEP 的 内 置 函数 polyeig 
当然 可 用 来 求解 QEP, 其 调用 格式 为 


[X,E]= polyeig (K,C,M),， 
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其 中 ,向 量 E 的 元 素 为 特征 值 . 另外 ,请 注意 参数 的 顺序 . 

关于 polyeig 函数 ,特别 要 注意 的 还 有 以 下 几 点 : 

(1)polyeig (A) 等 价 于 eig (A); 

(2)polyeig (A,B) 等 价 于 eig (A,-B); 

(3) 对 标量 ce ,……,ay 而 言 ,polyeig (a0, ..,ap) 等 价 于 roots ([ap .. a0]), 即 求 特征 多 项 
式 am 十 … 十 ai 十 ao 一 0 的 特征 根 . 

对 于 稠密 和 矩阵 的 SEP 和 GEP, 求 解数 值 解 的 标准 方法 是 将 涉及 的 矩阵 约 化 至 能 显 
露出 特征 值 的 某 种 较 简 单 的 形式 ,例如 ,单个 矩阵 4 的 Schur 标准 型 和 和 抢 阵 束 (4,B) 的 
广义 Schur 标准 型 . 遗憾 的 是 ,这 些 标准 型 不 能 推广 到 QQ) 这 样 的 次 数 大 于 1 的 ) 和 矩阵 . 

对 于 稠密 矩阵 ,QEP 的 数值 方法 可 分 成 两 类 : 一 类 是 通过 分 解 QQ) , 将 QEP 转化 
为 一 次 特征 值 问题 (个 SEP 和 1 个 GEP); 另 一 类 则 是 通过 线性 化 技术 ,将 QEP 转化 为 
与 之 等 价 的 GEP. 至 于 大 型 稀 朴 矩阵 的 QEP ,主流 的 仍然 是 投影 类 方法 ,本 书 略 去 不 谈 . 

1. 分 解法 

令 Q(S5)= 二 MS: 十 GS 十 K,SE C™, 则 有 


QQ) 一 20CS) = AM+MS+O A —S) (7 2. 9) 
这 就 是 二 次 矩阵 多 项 式 的 广义 Bezout 定理 . 显然 , 当 8(S) 二 0, 即 二 次 矩阵 方程 
Q(S) = MS 十 CS 十 K 一 O 
存在 ( 右 ) 解 (solvent) S 时 , 式 (7. 2. 9) 就 特殊 为 
CQ) = (OUM 十 MS 十 C)COT 一 S) 


此 时 detQ(4) 王 0 即 为 det(OUM 二 MS 十 C)detOQTI 一 S) =0, 因此 原 QEP 分 解 为 如 下 问题 : 
(1) 求 SEPSx = Xx 的 2 个 特征 对 ; 
(2) 求 矩阵 束 C(MS 十 C, 一 MD 的 GEP, 即 CMS 十 Ox 一 一 AMx 的 n 个 特征 对 . 
分 解法 存在 两 个 困难 . 首先 , 解 $ 可 能 不 存在 ,即使 解 存在 ,它们 的 条 件数 实际 中 也 
不 容易 检验 ;其 次 , 解 $ 的 计算 也 是 件 麻 烦 事 , 可 能 比 求解 该 QEP 更 困难 . 
2. 线性 化 方法 


对 于 微分 方程 (7. 2. 7) 的 解 x 一 eu , 易 知 x = 二 Ae&'u = 二 Ax. 因此 若 令 


x CQM 十 C)ay 
= ,Ww 一 | 1.2 10 
y 
以 及 A= Es i = I 站) (1 


则 (7. 2. 8) 中 的 QEP 被 蔡 换 为 如 下 的 等 价 系统 : 
Az = ABz ,wa 三 入 WEB 


我 们 称 此 GEP 是 原 QEP (7. 2. 8) 的 一 个 线性 化 (linearization). 
注意 到 矩阵 束 (4,B) 具有 如 下 分 解 : 
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2M 二 AMC 十 下 O 


攻 I 
O I 


-I 一 M 一 C 


Nie 
-M1 了 


因此 ,根据 4 和 矩阵 的 知识 ,我 们 知道 
12M 二 ACTK O 


Por | 

O I 

并 且 det(4 一 4B) 二 det (XM 十 i 十 KR). 这 意味 着 式 (7. 2. 8) 中 的 GEP 的 特征 值 就 是 原 
QEP 的 特征 值 ,同时 利用 式 (7. 2. 10) 就 可 得 到 原 QEP 的 特征 向 量 . 

上 述 线性 化 的 缺点 是 矩阵 4, 了 未 必 保 持 和 矩阵 M,C, 开 的 特殊 性 ,例如 当 M,C, 天 都 是 

Hermite 矩阵 时 ,和 矩阵 A 未 必 也 是 Hermite 矩阵 . 好 在 这 可 以 通过 对 A,B 的 修改 来 弥补 . 

因为 线性 化 不 是 唯一 的 ,所 以 我 们 可 选择 能 保留 QQ) 的 对 称 性 和 其 他 结构 特性 的 线 


性 化 . 

事实 上 ,实践 中 经 常 使 用 的 是 第 一 友 型 : 

| O NN 四 出 
Ll: A 一 ,B= 

= 小 一 人 O M 
或 第 二 友 型 : 

一 天 O C | 
L2; 人 一 ,有 一 

O 和 N NO 


其 中 , N 可 取 任 意 的 n 阶 可 道 矩 阵 . 选择 第 一 友 型 还 是 第 二 友 型 ,显然 取决 于 M 和 K 
的 奇异 性 . 一 般 将 N 选 为 单位 矩阵 或 者 单位 矩阵 的 倍数 ,例如 |MII 或 |KII. 显然 ， 
NN 王 工 的 情形 就 是 式 (7. 2. 11). 而 当 M,C,K 都 是 Hermite 矩阵 时 , 若 K 还 是 可 道 矩 阵 ， 
则 可 取 NN 二 K, 此 时 得 到 的 矩阵 4,B 都 是 Hermite 矩阵 . 

谱 变 换 法 在 GEP 中 发 挥 了 重要 作用 ,类 似 地 ,通过 对 QEP 实施 谱 变换 ,也 可 以 增强 
线性 化 方法 的 适用 范围 . 下面 对 之 做 些 简 单 介绍 . 

(1) 直 接 求 逆 法 . 如 果 和 希望 计算 某 些 从 模 来 看 值 最 小 的 特征 值 及 其 特征 向 量 , 当 0 不 
是 QEP 的 特征 值 ,也 就 是 矩阵 玉 可 逆 时 ,显然 可 考虑 倒 代 换 风 王 和 ,此 时 QEP (7. 2.8) 变 
形 为 QEP 

(M+yC+ py Rx 一 (0 
采用 线性 化 技术 之 后 ,可 得 如 下 GEP: 
1 


Az = 3Bz 72 12) 
其 中 
一 C 一 M K O 高 
A= » > sz 一 (7. 及， 13) 
I O O I Ax 
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此 时 和 矩 阵 束 (B,4) 具有 如 下 分 解 : 
I AM 
O I 


1 起 
B—AA = 


Wed kK O 
O I 


= I 
此 即 


且 一 M 一 


)2M 十 )C 十 天 ?| 
O I 
因此 GEP (7. 2. 12) 的 特征 值 就 是 原 QEP 的 特征 值 ,同时 利用 式 (7. 2. 13) 可 得 相 
应 的 特征 向 量 . 
直接 求 逆 法 的 好 处 是 位 于 原 QEP 的 谱 集 内 部 的 特征 值 可 被 变换 到 新 QEP 的 谱 集 
的 两 端 . 
(2) 位 移 求 逆 法 . 如 果 希 望 计算 指定 值 o 附近 的 某 些 特征 值 ,可 先 通过 位 移 = 王 和 一 5 
将 之 转化 为 求 0 附近 的 特征 值 ,再 结合 直接 求 逆 法 y 二 将 它们 变换 到 yi 的 谱 集 的 两 
端 ， 此 时 QEP (7. 2. 8) 变形 为 
QM +uC’ +K)x=0 (7. 2. 14) 
其 中 ,= 4 一 0) 7 M = 二 22M 十 oC 十 K,C 一 C 十 2aM,K 二 M. 同样 采用 线性 化 技 
术 之 后 ,可 得 如 下 GEP: 
bs 
I O 


x Mm 0 x 


1 
人 一 和 


(A—o)x O IT)\lQA—ox 


进而 可 求 得 原 QEP 的 特征 值 二 o 十 jx 及 相应 的 特征 向 量 x. 
(3)Cayley 变换 法 . 通过 Cayley 变换 


人 po 
其 中 ,任意 常数 a,B,t 满足 ar 一 B 隆 1, 这样 原 QEP (7. 2.8) 就 变 成 了 
| QM +uC’+K)x=0 (7. 2. 15) 


其 中 , M = 二 2M 十 tC 十 K,C = 一 2tBM 一 (ar 十 BC 一 20K, K = 二 FM 二 aBC 十 aK. 同 
样 , 原 QEP (7. 2. 8) 中 靠近 反 位 移 (antishift) z 的 特征 值 * 被 变换 到 QEP (7. 2. 15) 中 特 
征 值 wx 的 谱 集 的 两 端 ,同样 ,接近 位 移 B/a 的 特征 值 4 被 变换 到 QEP (7. 2. 14) 中 接近 于 
0 的 特征 值 y. 


7.3 ” Rayleigh 商 和 广义 Rayleigh 商 
瑞 利 勋 玫 在 1870 年 代 研 究 振动 系统 的 小 振荡 时 ,为 了 找到 合适 的 广义 坐标 ,提出 一 种 


特殊 形式 的 商 ,被 后 人 称 为 Rayleigh 商 . 在 物理 .信息 等 学 科 的 理论 研究 中 ,经 常 需 要 确定 
Hermite 矩阵 的 Rayleigh 商 的 极 值 ,以 及 两 个 Hermite 矩阵 的 广义 Rayleigh 商 的 极 值 . 
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7.3.1 Rayleigh 商 


对 二 次 型 xthx, 如 果 存 在 hx 二 x, 那么 显然 有 X= 二 天 人， 相应 地 ,如 果 Ahx Xx， 


XXX 
H 
我 们 自然 也 希望 成 立 一生 本 
H 
定义 7.3.1 设 A 是 Hermite 和 矩阵 , 称 R(x) 一 工 4 (x 关 0) 为 矩阵 和 4 的 Rayleigh 


XHX 
商 (quotient). 
显然 , R(x) 是 向 量 x 的 标量 函数 . 我 们 自然 希望 确定 此 函数 的 取 值 范围 或 极 性 . 注 
意 到 


RY) 一 二 人 - (FE) ACE) 一 RE 


因此 ,我 们 可 以 把 对 R(x) 的 极 性 的 讨论 限定 在 单位 球面 S= {x E C" | |xl: = 1} 上 . 
因为 单位 球面 S 是 闭 集 , 又 因为 R(x) 是 x 的 连续 函数 ,因此 根据 多 元 函数 的 最 值 定 
理 , R(x) 在 S 上 存在 最 大 值 和 最 小 值 . 由 于 特征 值 与 Rayleigh 商 的 关系 ,我 们 自然 会 问 : 
这 些 最 值 与 矩阵 4 的 特征 值 之 间 有 什么 关系 ? 
事实 上 ,Rayleigh 商 是 Hermite 特征 值 问题 的 “最 佳 逼近 ”, 即 对 任意 >E C ,有 


14x 一 RCcxls < |Ax—rxl; 
这 是 因为 由 Ax 一 rx 二 (Ax 一 ROY)X) 十 (R(X) 一 Px 以 及 xii(Ax 一 R(x)x) 一 0, 可 知 
|Ax—rxli = |Ax—ROOx|i+| RO) —N x = |Ar— Rx|? 
因为 4 是 Hermite 矩阵, 故 4 有 谱 分 解 4 二 UAU™, 这 里 了 是 酉 矩阵 , 则 
R(x) 一 xx 一 XUAUHx 一 (UHx)HACUHx) 
令 4A 三 diagA hj), 并 假定 ji 委 姑 迄 … 委 , 同 时令 URx 一 y 了 一 ( 册 ，, 罗 并 , 则 有 


lyl: = Tazls = |xl; = 1,RG) = Dl yl? 
t=1 
所 以 
N= yl SR Sh zr = 
i=1 i=1 


定理 7.3.1 (Rayleigh-Ritz) 设 A 是 Hermite 矩阵 ,其 特征 值 为 过 过 … 过 为, 则 


A = minR(x) = min x Ax, A, = max R(x) = max x!Ax CT, Ly 
7 入 0 xHix=1 ZA#0 wl 


Rayleigh-Ritz 定理 意味 着 R(x) 宇和 ,因此 不 断 地 改进 zz 的 取 值 ,可 以 用 R(x) 从 右 
侧 晕 近 4 的 最 小 特征 值 41. 类 似 地 , RCx) 过 ,因此 不 断 地 改进 x 的 取 值 ,也 可 以 用 
R(x) 从 左 侧 双 近 A 的 最 大 特征 值 M, 至 于 如 何 改 进 x 的 取 值 ,以 使 得 R(x) 取 到 这 些 极 
值 , 这 自然 让 人 联想 到 共 斩 梯 度 法 . 有 兴趣 的 读者 请 查阅 相关 文献 . 
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另外 , Rayleigh_Ritz 定理 中 的 条 件 “A 是 Hermite 矩阵 ” 必 不 可 少 , 例如 对 抢 阵 
ya 人 | , 定理 的 结论 就 不 成 立 . 

Hermite 和 矩阵 和 的 其 余 特征 值 是 否 也 有 类 似 结论 呢 ? 我们 先 来 考虑 特征 值 2 入. 

设 U 一 (yw,…,), 显然 ,我 们 要 考虑 那些 与 正 交 的 向 量 x, 即 xE span(w， 
U3 1 = WV,, 南 于 i 一 ulix 3 0， 因此 前 面 的 证 明 可 修改 为 


R(x) = xH4hx 一 Pall = Plyl >% Dll = 


类 似 地 ,考虑 那些 与 u 正 交 的 向 量 x, 即 xE span(twi ,rz ,"… U1) 二 Vi. 由 于 ,二 
zax 一 0, 因此 前 面 的 证 明 可 修改 为 


n Lm | nl 
R(x) = x"Ax = 2 1y:)? 至 Dhlyil’ SA 2) | yi|? = A 
i=1 Ga i=1 


推广 上 述 证 明 ,一 般 地 ,我 们 有 : 
定理 7.3.2 设 A 是 Hermite 和 矩阵 ,其 特征 值 为 妨 志 Xz 声 … 志和 ,相应 的 标准 正 交 
特征 向 量 为 Ul ，LL2 ， ,WU,. 令 V; = span(u; ,Ui Vi = (0)， 则 


pO dR = = minx Naw N= TD R(X = maxx" Ax (7. 3. 2) 
x | 0#xEVE Hl 
xEVi se 


遗憾 的 是 ,定理 7. 3. 2 中 的 公式 实用 价值 不 大 . 因为 它们 将 X; 的 计算 限定 在 求 Ray- 
leigh 商 在 Vi; 的 局 部 极 值 上 ,为 此 必须 先 求 出 Vi;, 这 在 数值 上 是 比较 困难 的 . 因此 必须 对 
其 加 以 改进 . 

由 于 V; 实际 上 是 C" 的 一 个 2 一 2 十 1 维 子 空间 ,因此 我 们 希望 将 搜索 极 值 的 空间 放 
大 到 任意 2 一 :十 1 维 子 空间 W;. 显然 , 增 大 后 的 集合 的 极 大 值 不 会 比 原 集合 的 小 , 极 小 
值 也 不 会 比 原 集合 大 . 

设 有 w E C”, 仍然 考虑 那些 与 w 正 交 的 向 量 x, 即 xE span (w)+ 寺 Wi 且 xl: 一 1, 则 


maxxa4x 一 maxx UAU x 
天 | W 


= max (UHIACUx) ( 信 Ux = y= (ys, y,)!) 


= sp may 2% |y;|*( 因 为 |y|; = |xl; = 
XW j=1 


区 ,ee 
二 max > Ai yi| = 生 > | > 
yLUHw i=1 FLUHw j= 
y1="=y, 2=0 y1=""=%, 2=0 


并 且 , 当 w 二 wu 时 等 号 成 立 . 因此 min (max XAxXY = A 
wEC” *EW, 
定理 7.3.3 (Courant-Fischer) 设 A 是 Hermite 和 矩阵 ,其 特征 值 为 和 1 过 1 去 … 去 
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2 » 则 
= max min R(x), N= min max R(x) (7. 8. 
dim(W)=mitl Hel dmW 1)=i Hl 
xEW CC” xEW, HICC"” 
Courant-Fischer 定理 又 被 称 为 Hermite 矩阵 特征 值 的 极 值 定理 . 根据 此 定理 ,可 以 
证 明 下 面 的 交错 定理 . 


定理 7.3.4 (Sturm 交错 定理 ) 设 A 是 Hermite 矩阵, A 的 r 阶 主子 矩阵 4A, 和 7 十 1 
阶 主子 矩阵 4, 的 特征 值 分 别 为 过 zt < 和 ju pe A pn 则 


npn" pr pn 
例 7.3.1 考虑 pascal 矩阵 


| 

1 2 3 4 
A= 

1] 3 6 10 

1 4 10 20 


显然 , o(A1) == {1},o(Ahs) 二 {0.3820,2.6180}, oa(Ahs) 一 10. 1270,1. 0000,7. 8730) ， 
o(A1) 一 {0.0380, 0.4538,2. 2034,26. 3047}. 不 难 发 现 它们 都 满足 Sturm 交错 定理 . 


7.3.2 广义 Rayleigh 商 
定义 7.3.2 设 A,B E€ Co 都 是 Hermite 和 矩阵 目 B 法 0, 则 称 


-Es (7. 3. 4) 


为 矩阵 束 4 相对 于 矩阵 如 的 广义 Rayleigh 商 , 简称 正定 矩阵 束 (4,B) 的 广义 
Rayleigh 商 . 
由 于 B 二 0, 因此 存在 平方 分 解 召 = 瑟 , 这 里 互 =B2 二 0. 令 x 一 百 1y7, 则 


_yH'AH'y__ yAy 
R(x) rf = (7. 3. 5) 


即 广义 Rayleigh 商 等 价 于 Hermite 矩阵 4 二 HA4H- 的 Rayleigh 商 . 因此 讨论 广义 
Rayleigh 商 的 极 性 时 ,只 需 在 椭 球 面 


Sg = {xXE€ C" | (x,x)s = xiBx = 1} 
上 讨论 ,注意 内 积 现在 是 B 内 积 . 

由 式 (7. 3. 5) 和 Rayleigh-Ritz 定理 可 知 ,当选 出 的 y 分 别 是 A 的 最 小 特征 值 和 最 大 
特征 值 所 对 应 的 特征 向 量 时 ,广义 Rayleigh 商 分 别 达到 最 小 值 和 最 大 值 . 若 设 0,y) 为 
和 4 的 特征 对 , 即 Ay = 二 和 y, 则 HTAy = HY?AH"'y = AH"'y. 注意 到 B11 二 HY, 因此 
B 4x 二 Ax, 此 即 Ax 二 XBx. 这 说 明 广 义 Rayleigh 商 达 到 的 是 广义 特征 值 问 题 hx 一 
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4Bx 的 最 值 . 
事实 上 ,按照 极 值 理论 , 易 知 广义 Rayleigh 商 R(x) 的 驻 点 xo 就 是 广义 特征 值 问 题 
Ax 二 XBx 的 特征 向 量 , R(xo) 就 是 相应 的 特征 值 . 这 是 因为 式 (7. 3.4) 可 改写 为 


2 
(xHBx)R(x) 二 xMAx ,两边 求 梯度 , 即 得 V .R(x) = ip 一 R(x)Bx),， 因此 


VxR(x) 二 0 当 且 仅 当 Axo 二 R(xo)Bxo. 

综合 上 述 , 即 得 推广 的 Rayleigh-Ritz 定理 . 

定理 7.3.5 (Rayleigh-Ritz) 设 A,B € C2" 是 Hermite 和 抢 阵 上 且 下 二 0. 并 设 广义 特 
征 值 问题 hx = MBx 的 特征 值 为 A1 过 Xz 三 … 三 和 , 则 


(7..3.6) 


类 似 地 ,我 们 有 : 
定理 7.3.6 设 A.BE C”™ 是 Hermite 和 矩阵 日 B 守 0, 并 设 广 义 特征 值 问题 Ax = 
ABx 的 特征 值 为 I < A 则 


和 三 独 a 汉 min x Ax, i;= min max xHAx 
dim(W,)=m tl Hgr=] dim(W, :11)=? | 
zEwiEen rE ICC" 


定理 7. 3. 6 又 称 为 广义 特征 值 的 极 值 定理 . 
7.3.3 乐 在 其 中 的 瑞 利 勋 副 


瑞 利 勋 珊 ( 见 图 7- 5) 原 名 约翰 ， 威 
廉 . 斯 特 拉 特 (John William Strutt ) , 尊 
称 瑞 利 男 需 三 世 (Third Baron Rayleigh). 
1861 年 ,他 考 入 剑桥 三 一 学 院 . 在 导师 劳 
斯 (Edward Routh,1831 一 1907, 以 现代 控 
制 理论 中 的 劳 斯 判 据 等 闻名 于 世 ) 的 精心 
辅导 下 ,他 于 1865 年 获得 数学 荣誉 学 位 ， 
并 列 最 优等 (Senior Wrangler). 当时 剑桥 
的 主 试 人 指出 :“ 瑞 利 的 毕业 论文 极 好 ,不 
用 修改 就 可 以 直接 付 印 . ”在 大 学 期 间 , 瑞 图 7-5 瑞 利 勋 副 (1842 一 1919) 
利 还 深 受 斯 托 克 斯 (George Gabriel Stokes, 1819 一 1903 ,以 曲线 积分 中 的 斯 托 克 斯 公式 
而 遐 偿 闻名 ) 的 影响 . 因为 当时 的 学 生 没有 亲自 动手 进行 实验 的 机 会 ,而 斯 托 克 斯 则 在 课 
程 讲授 中 将 理论 阐述 与 物理 实验 相 结合 ,这 给 瑞 利 提供 了 耳濡目染 科学 实验 的 机 会 ,也 
极 大 地 影响 了 瑞 利 的 科学 研究 之 路 . 瑞 利 本 人 后 来 也 提 到 了 斯 托 克 斯 对 他 走 上 科学 研究 
之 路 的 重要 影响 . 

1871 年 , 瑞 利 发 表 光 的 散射 理论 ,第 一 次 正确 地 解释 了 "天空 为 什么 是 蓝 色 的 ” 同 
年 ,他 村 了 大 学 同学 贝尔 福 伯 融 (Arthur James Balfour,1848 一 1930, 英 国保 守 党 核心 
人 物 ,1902 一 1905 年 间 担任 英国 首相 ) 的 妹妹 . 婚 后 不 久 , 他 染 上 了 严重 的 风湿 热 , 差 
点 竺 了 性 命 . 大 病 初 愈 后 ,他 接受 医生 的 建议 , 携 妻 赴 埃 及 旅游 . 这 次 旅行 不 仅 恢 复 了 
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他 的 健康 ,而 且 还 催生 了 他 的 名 著 《 声 学 理论 ). 出 版 于 1877 年 的 该 书 第 一 卷 论 述 了 振 
动 发 声 媒质 的 力学 ,次 年 出 版 的 第 二 卷 则 论述 了 声波 的 传播 ，Rayleigh 商 就 出 现在 此 
书 之 中 ， 

1879 年 ,麦克 斯 韦 去 世 , 瑞 利 应 邀 担任 空缺 的 剑桥 大 学 卡 文 迪 许 实验 室 主任 ,直至 
1884 年 主动 辞职 . 他 对 这 份 工作 投入 了 全 部 身心 ,也 对 剑桥 的 物理 教学 做 出 了 意义 深远 
的 改革 . 担任 实验 室 主 任期 间 , 他 多 方 筹集 资金 ,为 实验 室 添置 了 大 批 的 新 仪器 ,因为 他 
觉得 实验 室 应 该 是 教学 和 研究 的 中 心 . 后 来 ,该 实验 室 培 养 了 多 位 诺 贝 尔 奖 得 主 . 除了 
他 自己 获 1904 年 诺 贝尔 物理 学 奖 外 ,接替 他 的 汤姆 逊 (Joseph John Thomson, 1856 一 
1940) , 因 在 这 里 发 现 了 电子 , 获 1906 年 的 诺 贝尔 物理 学 奖 . 还 有 汤姆 逊 的 学 生 卢 瑟 福 
(Ernest Rutherford,1871 一 1937) ,也 是 在 这 里 ,利用 a 射线 发 现 了 原子 的 “行星 式 ” 有 核 
结构 ,第 一 次 打开 了 原子 的 大 门 ,并 于 1908 年 获 诺 贝尔 化 学 奖 ， 瑞 利 要 求学 生 都 要 通过 
实验 来 学 习 和 研究 物理 ,为 此 他 开发 了 热学 .电磁 学 .物质 的 性 质 . 光 学 和 声学 等 方面 的 
实验 课程 . 由 他 开创 的 这 种 培养 学 生 的 方法 从 此 在 欧美 的 大 学 流传 开 来 . 

瑞 利 被 授予 诺 贝 尔 物理 学 奖 , 是 为 了 表彰 他 于 1895 年 发 现 了 惰性 气体 毛 这 一 重要 
成 就 . 之 所 以 授予 他 物理 学 奖 , 是 因为 当年 的 化 学 奖 授予 了 拉 姆 塞 (William Ramsay， 
1852 一 1916) ,他 与 瑞 利 共同 发 现 了 毛 , 进 而 于 1898 年 发 现 了 惰性 气体 族 中 其 他 的 成 员 
氢气、 氮 . 同年 的 两 项 诺 贝尔 奖 颁 给 同一 项 伟大 的 发 现 , 可见 发现 惰性 气体 元 素 的 重要 

提起 惰性 气体 的 发 现 , 我 们 不 能 不 提 到 汤姆 逊 的 话 :“ 大 部 分 学 者 认为 科学 的 想象 力 更 
胜 于 精确 的 量度 . 其 实 , 瑞 利和 拉 姆 塞 的 工作 证 明 :一切 科 学 上 的 伟大 发 现 , 几乎 完全 来 自 精 
确 的 量度 和 从 大 量 伪 数字 中 明察秋毫 . ”事实 上 ,1882 年 , 瑞 利 就 曾经 测 过 氧 和 氧 的 密度 . 经 
过 十 年 长 期 的 测定 ,他 宣布 所 和 氧 的 原子 量 之 比 实际 上 不 是 1 : 16 ,而 是 1 : 15. 882. 他 还 测 
定 了 氮 的 密度 ,发现 从 液态 空气 中 分 馅 出 来 的 所 ,跟从 亚 硝 酸 铵 中 分 离 出 来 的 氮 , 密度 有 
微小 的 但 却 是 不 可 忽略 的 偏差 ,前 者 的 密度 为 1. 2572 g/cm ,而 后 者 的 密度 却 为 1. 2505 
g/ cm . 尽管 两 者 的 数值 仅 相差 和 分 之 几 , 但 他 认为 ,这 一 差异 远 远 超出 了 实验 误差 范围 ， 
一 定 有 尚未 查 清 的 因素 在 起 作用 . 为 此 ,他 先后 提出 过 几 种 假说 来 解释 造成 这 种 不 一 臻 
的 原因 . 两 年 后 , 瑞 利 在 英国 皇家 学 会 宣读 了 他 的 实验 报告 ,只 有 拉 姆 赛 表 示 有 兴趣 和 他 
合作 . 拉 姆 赛 重复 了 瑞 利 的 实验 ,宣布 证 实 了 瑞 利 的 结果 . 两 位 科学 家 在 经 过 严密 的 研究 
后 ,于 当年 确定 了 第 一 个 惰性 气体 , 取 名 为 毛 , 其 希腊 文 的 原意 是 “不 活泼 >“ 懒 惰 ” 的 
意思 ， 

惰性 气体 毛 的 发 现 , 应 该 说 是 瑞 利 严谨 的 科学 态度 .广博 的 科学 知识 和 精深 的 科学 
研究 的 必然 结果 . 有 人 统计 了 瑞 利 的 出 版 物 ,居然 达到 446 项 之 巨 ,涉及 物理 和 应 用 数学 
的 许多 方面 ,其 中 物理 方面 有 声学 、 波 的 理论 .彩色 视觉 .电动 力学 .电磁 学 、 光 的 散射 , 液 
体 的 流动 .流体 动力 学 .气体 的 密度 、 粘 灌 性 .毛细 作用、 弹性 和 照相 术 , 等 等 . 他 于 1879 
年 发 表 的 行 波 理论 如 今 已 发 展 为 孤立 子 理论 . 因此 ,他 被 视 为 19 世纪 末年 达到 经 典 物 理 
学 匮 峰 的 少数 学 者 之 一 . 

瑞 利 的 家 族 里 之 前 没有 人 对 科学 表露 出 丝毫 兴趣 , 优 浊 的 生活 也 使 得 他 完全 不 必 靠 
科学 研究 谋生 . 纵 观 他 的 一 生 ,我 们 可 清晰 地 追寻 到 斯 托 克 斯 对 他 的 深刻 影响 . 这 种 影响 
使 得 他 愿意 购买 仪器 设备 ,并 在 自己 的 庄园 里 组 建 实验 室 , 以 开展 科学 实验 . 这 种 影响 也 
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使 得 他 改革 了 剑桥 的 物理 教学 . 或 许 也 正 是 这 种 影响 ,使 得 他 不 顾 许多 同事 的 婉言 相 劝 ， 
毅然 辞去 了 卡 文 迪 许 实验 室 主 任 一 职 , 转 而 集中 精力 从 事 科 学 研究 . 所 有 这 些 行为 背后 
的 动因 ,或 许 用 他 自己 的 话 更 能 说 明 清 楚 . 他 曾 把 自己 的 论文 整理 为 五 卷 本 的 论文 集 . 在 
论文 集 的 开头 ,他 写 下 了 这 样 的 言词 : 

伟大 精深 啊 ， 

上 帝 造 物 之 奇妙 ! 

研究 探索 吧 ， 

求 得 世界 的 奥秘 ， 

乐 在 其 中 侨 ! 


7.4 ”特征 值 问题 的 数值 算法 综述 


由 于 存在 大 量 应 用 , 随 着 计算 能 力 的 提高 ,特征 值 的 数值 计算 尤其 是 大 型 计算 如 今 
已 引起 越 来 越 多 的 关注 . 特征 值 的 算法 也 与 高 性 能 计算 CHPC) 存 在 密切 的 关系 . 

在 求解 特征 值 问题 时 ,需要 考虑 的 因素 远 远 多 于 求解 线性 方程 组 ,因为 不 同 的 因素 
极 大 地 决定 了 算法 的 不 同 选 择 . 仅 就 标准 特征 值 问 题 Ax 二 Xx 而 言 ,就 需要 考虑 下 列 
因素 : 

(1) 4 是 实 和 矩阵 还 是 复 矩 阵 ? 

(2) 4 是 否 具 有 某 些 特殊 性 质 , 例 如 A 是 实 对 称 矩 阵 、Hermite 矩阵 或 西 矩阵 吗 ? 

(3) 4 是 否 具 有 某 种 特殊 结构 ,例如 4 是 带 状 矩阵、 稀 玖 矩阵 或 Toeplitz 矩阵 吗 ? 

(4) 需要 求 4 的 哪些 特征 值 ,比如 最 大 的 特征 值 . 绝 对 值 最 小 的 特征 值 还 是 特征 值 的 
实 部 ? 

尽管 如 此 ,一 般 仍 可 将 特征 值 问题 大 致 划分 为 求解 中 小 型 稠密 和 矩阵 全 部 特征 值 的 变 
换 类 方法 和 求解 大 型 稀疏 和 矩阵 部 分 特征 值 的 投影 类 方法 ,前 者 以 QR 算法 为 代表 ,后 者 
则 以 Krylov 子 空间 类 方法 为 标志 . 


7.4.1 扰动 和 敏感 性 
我 们 在 7. 1. 1 小 节 已 经 指出 ,和 矩阵 的 特征 值 是 连续 地 依赖 于 和 矩阵 元 素 的 ,但 这 种 依 


祯 关系 对 扰动 的 敏感 程度 却 千差万别 . 以 矩阵 4 一 { 。 。) 为 例 , 显 然 4 的 特征 值 为) 一 


入 一 2. 如 果 在 (1,2) 位 置 有 一 处 扰动 > 0, 即 扰动 拓 阵 为 至 = (”“) ,显然 A 十 E 的 
特征 值 仍 为 同一 入 三 2, 即 特征 值 不 受 影响 ;如 果 在 (1,1) 或 (2,2) 位 置 有 一 处 扰动 e 守 
0, 则 和 4 十 EE 的 特征 值 为 ji == 2 十 e,ps = 二 2 或 jw 二 2,p 一 2 十 s, 即 特征 值 的 扰动 幅度 与 
元 素 相同 ;如 果 在 (2,1) 位 置 有 一 处 扰动 之 0, 则 A 十 EE 的 特征 值 为 = 2 十 Ve ,ps 一 
2 一 Ve ,不仅 重 特征 值 变 成 了 相 异 特征 值 ,使 得 特征 子 空间 由 1 维 变 成 了 2 维 , 即 特征 值 
问题 的 结构 发 生 了 变化 ,而 且 特 征 值 的 扰动 幅度 也 比 元 素 大 得 多 (例如 元 素 的 扰动 为 。 = 
10-” 时 ,特征 值 的 扰动 上 升 到 ye = 10™"，, 两 者 相差 107 倍 之 巨 ). 如 果 和 矩阵 有 多 处 扰动 ， 
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由 此 产生 的 复杂 情况 可 想 而 知 . 

注意 到 上 面 的 矩阵 A 是 亏损 矩阵 ,这 说 明 非 亏损 矩阵 的 情况 应 该 要 简单 一 些 . 事实 
上 ,对 非 亏 损 和 矩阵, 存在 下 面 的 扰动 定理 . 

定理 7.4.1 (Bauer-Fike) 设 A,BE Co ,其 中 4 是 非 亏 损 矩 阵 , 即 存在 可 道 矩阵 忆 
和 对 角 和 矩阵 A，, 使 得 4 = PAP-, 则 对 任意 Aw E c(CB), 必 存 在 1 E c(4) ,使 得 


min|4a—p|< |Pl,lP .1B—Al. (7. 4&. 1) 
AEo(A) 


苯 丰 ;= 1] 
证 明 : w € c(C4) 时 结论 显然 成 立 . 设 针 ol4), 则 yl 一 A 是 可 道 和 矩阵 . 设 x 是 矩阵 B 对 
应 的 特征 向 量 , 则 有 (B 一 A)x 二 I 一 A)x, 由 于 I 一 A 二 PI 一 A) P', 因此 可 得 
x=P(uI—AP (BB— A)x 
两 边 取 范 数 v (wv 二 1,2,o%o), 利 用 上 xl, > 0 及 矩阵 范 数 的 相 容 性 ,可 得 
1<lI—A ,Pl,lP ,1B—Al, 
注意 到 (I 一 A)7 是 对 角 矩 阵 , 其 范 数 (I 一 A) |, = max|4 一 y| ， 因 此 定理 成 
立 . 证 毕 . 

由 Bauer-Fike 定理 可 知 , cvs(CP) 二 |P| ,|P- | 是 特征 值 扰动 估计 中 的 放大 系数 . 考 
虑 到 和 矩阵 P 了 不 是 唯一 的 ,因此 取 x,(P) 的 下 确 界 即 infk,CP) 为 特征 值 问 题 的 条 件数 , 记 为 
ks,(A) 或 kx(A). 显然 ,对 于 正规 矩阵 4 而 膏 ， 卫 是 本 和 矩阵, 而且 K2 (A) = 1， 因此 正规 矩阵 
(包括 实 对称 和 矩阵 和 Hermite 矩阵 ) 总 是 良 态 的 . 

要 特别 注意 的 是 ,关于 特征 值 问题 hx = Xx 的 条 件数 x(4) = inflP| ,P|,, 与 关 
于 和 矩阵 4 求 着 和 关于 求解 线性 方程 组 4Ax 二 5b 的 条 件数 x(4) = 4| .14 站 是 完全 不 同 
的 两 个 概念 ,虽然 它们 的 计算 公式 类 似 . 例如 对 箱 阵 4 一“ “), 两 者 的 (4) 分 别 
是 1 和 10”, 可 见 一 个 是 良 态 的 ,而 男 一 个 则 严重 病态 . 

如 前 所 述 , 对 亏损 矩阵 即 非 正规 矩阵 的 扰动 ,情况 非常 复杂 ,其 中 既 可 能 有 对 扰动 很 
敏感 的 特征 值 ,也 可 能 有 对 扰动 不 敏感 的 特征 值 . 因此 ,我 们 有 必要 考虑 单个 特征 值 的 拓 
动 理论 . 

设 Q,x,y) 为 矩阵 的 特征 三 元 组 ,上 且 |xl; = |y|; = 1. 再 设 A 有 扰动 eE, 其 中 ， 
El; = 1, 且 A 十 aE 的 特征 对 为 (4(e),x(e)). 显然 , 和 (0) 二 ,x(0) 二 x， 对 等 式 


(ATeE)x(e) = A(l(e)x(e) 


两 边关 于 s 求 导 , 并 令 s= 0, 可 得 到 Ax (0) 十 Ex 二 4(0)zx 十 4x (0), 用 yt 左 乘 两 边 ,并 
注意 到 yn4 二 Ay , 则 有 yiEx 一 和 (0) yix, 从 而 


J 
[yix| cos0 


. H 
ol= |2 可 |< 


其 中 0 为 x 与 ?之 间 的 夹 角 . 当 取 瑟 = xy? 时 ,等 号 成 立 . 显然 s(4) = | yiHx| 的 倒数 反映 
了 扰动 的 上 界 , 因 此 我 们 称 之 为 单 特征 值 的 条 件数 . 
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以 上 分 析 表 明 , 当 和 矩阵 4 有 量 级 为 s 的 扰动 时 ,其 特征 值 4 的 扰动 可 能 会 达到 
e/s(4)， 因此 s(2) 很 小 时 ,我 们 就 有 理由 相信 和 是 病态 的 . 注意 到 s(4) 是 x 与 y 的 夹 角 余 
弦 cosb, 因此 当 4 是 单 特征 值 时 s(4) 是 唯一 的 . 另外 , 当 x 与 了 接近 于 正 交 时 , 非常 
敏感 ;而 当 x 与 y 接近 于 平行 时 , 4 几乎 不 敏感 . 事实 上 ,我 们 知道 ,对 实 对 称 矩 阵 和 
Hermite 矩阵 ,有 x 二 y, cos9 二 1, 因此 相应 的 4 是 良 态 的 ,这 与 前 面 的 分 析 也 是 吻合 的 . 

Matlab 早期 的 eig 函数 和 eigs 函数 都 没有 计算 单 特征 值 的 条 件数 ,利用 后 来 增加 的 
polyeig, 可 以 计算 这 些 条 件数 . 对 于 标准 特征 值 问 题 ,其 调用 格式 为 


[X, e, s] = polyeig (A,I) 


其 中 ,向 量 s 中 就 保存 了 各 个 特征 值 的 条 件数 . 
7.4.2 响 法 与 反 宪法 


竹 法 反映 了 计算 矩阵 特征 值 最 古典 、 最 简单 的 思想 . 它 充分 利用 了 和 矩阵 向 量 积 的 优 
点 ,特别 是 对 于 稀疏 矩阵 ,有 很 高 的 计算 效率 . 

设 4E C”, 且 存在 可 道 矩 阵 半 == (xi ,xs，…,x,) 和 对 角 和 矩阵 A = diag (41 ,Xs ，…， 
h) ,使 得 A 二 XAX-, 即 4 是 可 对 角 化 矩阵 . 又 设 


[il> Xl… 宇 || (7. 4. 2) 


其 中 , 按 模 最 大 的 特征 值 X 称 为 主 特征 值 (principal eigenvalue) ,相应 的 x 称 为 主 特征 向 
量 (principal eigenvector). 显然 , A1 是 非 零 的 单 特征 值 . 
对 任意 初始 向 量 x”，, 知 法 的 迭代 格式 就 是 


六 = 人 人 (k= 1,2,°") (7. 4. 3) 
由 于 存在 线性 组 合 x 二 2》 a;xi, 则 
1 一 1 


XxX? 一 4Ax eeD =Ax® 一 1 二 》 aAix; 王 开 | wa 十 p> Chi | A1)*@ix; | 
i=1 i=1 多 


显然 ,由 于 |A/1| 二 1, 故 有 x** 一 limx” 一 aixl， 即 x% 最 终 会 趋向 于 主 特征 向 
量 x , 这样 x% 可 作为 xi 的 近似 值 . 
我 们 又 该 如 何 求 A 的 近似 值 呢 ?” 若 记 mm = | 上 x。, 则 当 有 污 1 时 显然 有 


mx 全 i | 四 | ox | 。 


从 而 [1411= lim a ， 即 x” 前 后 两 次 迭代 的 oo 范 数 的 比值 ,就 趋向 于 A 的 主 特征 值 的 模 


[a1l. 

当然 ,联想 到 对 于 给 定 的 近似 特征 向 量 x ,Rayleigh 商 R(x%) 是 对 应 的 最 佳 近似 
特征 值 ,因此 更 简单 的 办 法 应 该 是 用 R(x ) 来 求 改 的 近似 值 . 

为 防止 汶 出 , 寡 法 的 实现 中 一 般 还 采用 规范 化 技术 . 

至 此 ,我 们 可 将 寡 法 的 迭代 格式 (7. 4. 3) 更 改 为 
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my 一 |x® |asy® = x*) ma sXe = Ay® 二 (YT ER (有 一 0,1,2,…) 
| (7. 4. 4) 
类 似 地 ,欲求 按 模 最 小 的 特征 值 及 其 特征 向 量 ,只 要 借助 于 谱 变换 技术 中 的 倒 变换 


将 之 转化 为 寡 法 即 可 . 这 就 是 反 适 法 的 思想 . 
仍 设 A € C” 是 可 对 角 化 矩阵 ,其 特征 值 为 1 ，… 又 设 


| 办 | 区 | 息 | 芝 常任 | 和 了 | 六 多 |] 六 浊 (7. 4. 5) 
其 中 , 按 模 最 小 的 特征 值 4, 是 非 零 的 单 特征 值 . 则 A 可 道 且 A 的 特征 值 满 足 
|X 窒 辣 这 | 证 | (7. 4. 6) 


即 和 :为 4” 的 主 特征 值 , x, 是 相应 的 主 特征 向 量 . 显然 反 震 法 等 价 于 对 A 使 用 军法 . 
此 时 相应 的 迭代 格式 即 为 
和 > UU (Lix*D), mx 一 1 7 wm x 2 y® /mx (k 一 1,2,…) (7.4.7) 
其 中 ,要 求 迭代 开始 前 对 和 矩阵 A 做 LU 分 解 , 并 在 每 次 迭代 中 通过 分 别 求解 三 角形 方程 
组 到 i x 和 Uy®™ 二 喝 来 确定 y*. 7 
7.4.3 ”QR 算法 
QR 算法 是 20 世纪 十 大 算法 之 一 ,是 计算 中 小 型 稠密 和 矩 了 泗 A € C” 全 部 特征 对 最 
常用 和 最 有 效 的 方法 . 实际 上 ,Matlab 的 内 置 函 数 eig 就 是 基于 QR 算法 来 实现 的 . 
最 基本 的 QR 算法 基于 的 就 是 如 下 的 QR 迭代 : 
(1) 令 Ai; 一 A. 
(2) 对 二 1,2,… 重复 下 列 步骤 ,直至 收敛 : 
OD 对 A 做 QR 分 解 : A = QR,; 
© 将 分 解 得 到 的 0 和 RR, 颠倒 相 乘 ,得 到 AcH， 即 令 A = 有 Ce 
显然 ,在 上 述 基本 QR 算法 中 ， 4 = QR 9 此 即 OHA， = R., 因此 
Aiati = RQ Fe ORALO。， OR A, 1Q4. 1 (0 
= = QQ OO… 0 10, = OAO, 


其 中 , 0; 二 Q.… CC 因此 迭代 序列 {A ) 保持 4 的 特征 值 不 变 . 
同时 ， 由 于 入 pia 一 Qn Re » Oi = OQ ， 因此 


40. = 004 = OQRe = Ry 
今 R, = 有 Re Rl1, 则 Re = Rin 及 》 从 而 
Oi Ri 40， R, = A(AO, R11) 二 *** 一 A* . QR 一 A*t! 


即 4* 二 QRi, 其 中 ;仍然 是 西 和 矩阵 , 及 仍然 是 上 三 角 和 矩阵 ,这 说 明 QR 迭代 实际 上 也 是 
对 A* 作 QR 分 解 . 
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可 以 证 明 , 上 述 基本 QR 算法 满足 如 下 的 基本 收敛 定理 : 
定理 7.4.2 设 4ECz 的 特征 值 按 模 是 互 不 相同 的 , 即 


[| il=>…> |h|>>0 (7. 4. 8) 


并 且 存 在 可 道 矩 了 泗 P 了 和 对 角 和 矩阵 A，, 使 得 4 二 PAP . 设 和 矩阵 P 具有 LU 分 解 P” = 
LU, 则 上 述 基 本 QR 算法 产生 的 矩阵 序列 {A } 基本 收敛 到 上 三 角 和 矩阵 T, 且 {A } 对 角 
元 的 极限 为 


lima 多 一 Ai (二 一 yD) 


这 里 ; A 一 (za 的 am 

定理 7.4.2 中 的 基本 收敛 指 的 是 矩阵 序 序列 (A) 的 对 角 元 均 收 敛 , 且 {A ) 的 严格 下 
三 角 部 分 的 元 素 都 收敛 到 零 . 至 于 {As} 的 严格 上 三 角 部 分 的 元 素 是 否 收敛 ,这 里 就 不 必 
关心 了 ,因为 对 求 A 的 特征 值 而 言 ,基本 收敛 已 经 足够 了 . 

定理 7.4.2 也 说 明 , QR 迭代 也 可 以 看 成 是 对 4 作 Schur 分 解 . 特别 地 ,如 果 4 是 
Hermite 矩阵 ,那么 上 三 角 和 矩阵 就 变 成 了 对 角 和 矩阵 . 也 正 是 由 于 QR 算法 的 成 功 , 人们 
才 开 始 重 视 起 Schur 分 解 ,使 得 在 数值 计算 中 Schur 分 解 最 终 取代 Jordan 分 解 ,成 为 了 
大 家 最 偏爱 的 矩阵 标准 型 . 

当 4E R” 时 ,由 于 QR 算法 的 计算 量 较 大 ,出 于 节约 计算 成 本 的 缘故 ,在 数值 实现 
时 一 般 先 通过 正 交 相似 将 矩阵 A 变换 成 上 Hessenberg 和 矩阵 百 , 然后 再 对 互 使 用 QR 迭 
代 将 之 化 成 上 三 角 和 矩阵 T. 特别 地 , 当 A 是 实 对 称 和 矩阵 时 ,和 矩阵 4 先 被 变换 成 三 对 角 矩 
阵 , 然 后 再 使 用 QR 迭代 化 成 了 对 角 和 矩阵 . 

类 似 地 ,我 们 也 可 以 采用 位 移 技术 来 提高 算法 的 收敛 速度 . 当 A € R™ "un 设 wx E 
R 是 特征 值 的 近似 值 , 则 带 一 步 位 移 的 基本 QR 算法 为 : 

(1) 令 4 一 4; 

《2) 对 & 一 1,2,… 重复 下 列 步 又 ,直至 收敛 : 

对 A 一 sl 做 QR 分 解 , 即 Ai 一 sl 二 QR,; 
@ 将 Q 和 Ri 颠 倒 相 乘 后 ,再 加 回 位 移 , 即 令 Ap 二 RiQ4 十 sl. 

由 于 Au 一 = RQ + sl 一 QiQRiQ, 十 2 = QF (A — sl) Qi sl = QiA:Q: ,因此 
上 述 算法 得 到 的 迭代 序列 (Ai) 仍然 是 两 两 正 交 相 似 的 , 即 迭 代 序 列 {Ai } 保持 4 的 特 
征 值 不 变 . 

作为 QR 分 解 的 应 用 ,下 面 我 们 介绍 QZ 算法 . 

例 7.4.1 (基于 广义 Schur 分 解 的 QZ 算法 ) 对 于 广义 特征 值 问题 Ax = XBx, 我 
们 的 目标 是 寻找 可 逆 和 矩阵 Q,Z, 使 得 


C 4Z， B= QBZ 


均 为 标准 型 ,这 里 矩阵 束 (4,B) 与 (41 ,Bi) 是 等 价 的 . 注意 等 价 矩 阵 束 的 特征 对 之 间 存 
在 关系 : 


Ar=ABxrSOAy=ABy, x=Zy 
与 矩阵 4 的 Jordan 标准 型 类 似 , 和 矩阵 束 (4,B) 也 存在 Weierstrass 标准 型 及 Krone- 
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cher 标准 型 ,但 前 面 已 指出 Jordan 标准 型 在 数值 计算 上 不 敌 Schur 分 解 , 类 似 地 ,对 和 矩阵 
束 (4,B), 从 数值 观点 看 ,更 吸引 人 的 是 Moler 和 Stewart 于 1973 年 提出 的 广义 Schur 
分 解 , 即 对 和 矩阵 4,B E Co , 存在 西 和 矩阵 2,Z, 使 得 


下 = 


都 是 上 三 角 和 矩阵 . 

我 们 知道 ,在 矩阵 4 的 Schur 分 解 4 = 二 UMTU 中 ,上 三 角 工 的 对 角 元 就 是 4 的 特征 
值 . 与 之 类 似 , 在 广义 Schur 分 解 中 , 当 S 的 对 角 元 汪 和 关 0 时 ,有 》 一点 /5 ， 其 中 己 为 了 
的 对 角 元 . 

问题 是 当 5; 一 0, 丰 天 0 以 及 总 一直 二 0 时 ,前 者 出 现 无 穷 特征 值 , 即 = 二 oo, 后 者 
的 特征 值 则 可 取 任 意 复数 , 即 此 时 特征 值 的 谱 2(4,B) 一 C. 

求解 广义 特征 值 Ax 二 4Bx 的 QZ 算法 分 三 步 : 

(1) Hessenberg-Triangular 约 化 , 即 通过 西 变 换 先 将 4 化 为 上 Hessenberg 和 矩阵 HH， 
将 B 化 为 上 三 角 阵 Si; 

(2)QZ 迭代 , 即 对 4B“ 使 用 带 一 步 位 移 的 基本 QR 算法 ,将 互 化 为 上 三 角 阵 或 准 上 
三 角 阵 T, 同时 将 $ 化 成 上 三 角 阵 $, 这 是 本 算法 的 核心 部 分 ; 

(3) 计 算 TS 的 特征 对 ,并 据 此 求 出 原 GEP 的 特征 对 . 

Matlab 提供 了 内 置 函数 qz, 可 用 于 计算 矩阵 束 (4,B) 的 QZ 分 解 ,并 且 Matlab 的 内 
置 函 数 eig 就 是 基于 QZ 算法 来 求解 广义 特征 值 问题 的 . 


7.4.4 Krylov 子 空间 法 


同上 一 章 一 样 , 本 节 仅 考虑 实 抢 阵 . 实际 上 ,对 复 和 矩阵 也 有 类 似 的 Krylov 子 空间 法 . 

对 于 大 型 矩阵 4 的 特征 值 问题 , 同 解 线 性 方程 组 的 情形 一 样 , 目 前 主流 的 方法 仍然 
是 Krylov 子 空间 法 ,其 中 ,根据 矩阵 A 是 否 对 称 ,又 可 细 分 为 Arnoldi 法 和 Lanczos 法 . 
上 一 章 已 经 指出 ,当初 正 是 克 雷 洛 夫 建议 用 和 宪法 所 形成 的 矩阵 序列 x,Ax ,A?x,… 来 确定 
特征 多 项 式 的 系数 ,所 以 Krylov 子 空 间 法 可 谓 是 寡 法 的 自然 推广 . 

对 标准 特征 值 问 题 Ax 二 ix, 其 中 A € R”,A € C,x 关 0, 我们 仍然 可 以 使 用 
Galerkin 原理 . 设 Ks 二 Span(m yw) 和 Lj 二 span(Wwi ww 都 为 k 维 子 空 间 ， 
它们 的 标准 正 交 基 构 成 矩阵 

Vi = Cpiypeser he), We = (Wi was, WwW) 

若 在 K 中 已 算得 4 的 近似 特征 向 量 x ，, 即 Ax% Ax 中 (否则 已 得 到 精确 解 x” = 
x ) , 则 存在 y® 天 0， 使 得 X 一 Viy®. 记 yrw 一 AViy® —AViy® 并 仍 取 Galerkin 条 件 
ro | Ck， 可 得 


(WiAVi) y® = XA, ye AO (7. 4. 9) 


因此 一 旦 算出 小 型 特征 值 问题 (7. 4. 9) 的 特征 对 (Mk,y% ),， 就 有 可 能 算出 矩阵 4 的 
近似 特征 对 值 (xx ,Vey 中). 

如 果 仍 然 选 取 C4 一 KK 并 用 Arnoldi 过 程 构造 Kc 的 正 交 基 Vi ,ys ，… » Ve 则 同样 可 
得 A 的 Hessenberg 分 解 
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ViAV, = ViH,' + uel (7,.4, 区) 
其 中 , HH 为 上 Hessenberg 矩阵 , wx 二 hai vas 以 及 
ViAV, = H, (7. 4.11) 
并 且 当 (0.,y”) 为 Hi 的 特征 对 时 ,有 
(A—QD Vy® = hely ev | A—QD Vy® | 一 有 nelegyw| 


其 中 , 4 被 称 为 Ritz 值 , x” 王 Viy 被 称 为 Ritz 向 量 . 显然 , 当 hiwi 二 0 时 有 Ax* 一 
Gx ， 即 Ritz 值 G% 和 Ritz 向量 x” 分 别 为 原 和 矩阵 4 的 最 佳 近似 特征 值 4 和 相应 的 特征 
向 量 . 这 就 是 Arnoldi 算法 的 思想 . 
在 Arnoldi 算 法 中 ,如 何 计算 上 Hessenberg 矩阵 到 的 特征 对 (9,，y”) 呢 ? 考虑 到 
k < 之 ,因此 k 阶 矩阵 Hi 显然 是 中 小 型 矩阵 ,其 特征 对 的 计算 可 使 用 QR 算法. 
至 此 ,我 们 可 给 出 如 下 Arnoldi 算法 : 
(1) 任 取 初 始 向 量 x , 满足 x, = 1; 
(2) 对 二 1,2,… 重复 下 列 步骤 ,直至 余 量 范 数 hei | eg y® | 小 于 某 个 阔 值 ; 
Q@ 使 用 CGS 算法 或 MGS 算法 完成 & 步 Arnoldi 过 程 ,得 到 上 Hessenberg 矩阵 HH ; 
@ 使 用 QR 算法 或 其 他 方法 求 出 本 的 特征 对 (0 ,y* ); 
@ 计算 z = Viy ,并 置 三 入 , 从 而 得 到 A 的 近似 特征 对 Qi ,x*). 
Arnoldi 算法 是 求解 大 型 稀 玻 徐 阵 极端 (最 大 和 最 小 ) 特 征 值 很 有 效 的 方法 ,其 收敛 
速度 比 军法 快 得 多 ,而 且 可 选用 比 n 小 得 多 的 & < n, 因此 所 需 的 存储 量 也 相当 有 限 . 
当 我 们 将 Arnoldi 算法 应 用 到 实 对 称 和 矩阵 时 ,就 得 到 了 Lanczos 算法 ,因此 Lanczos 
算法 可 视 为 Arnoldi 算法 的 特殊 情形 ,尽管 在 历史 上 两 者 是 各 自 独立 发 展 出 来 的 . 
设 AE SR”,AE€ C,x 关 0, 并 用 与 Arnoldi 过 程 类 似 的 过 程 构造 Kx 的 正 交 基 vi， 
Ves Ws 则 类 似 可 得 A 的 三 对 角 分 解 


AV; = ViT, + uel (7 12» 
a Bh 
其 中 , T 为 对 称 的 三 对 角 和 矩阵 , 记 为 五 一 | 一 和 | =ppnvB 及 
六 了 
VEAW = T, (7. 4. 13) 
显然 ,由 式 (7. 4. 12) 可 知 
Av; = BiviitavtBvn (i= 1,2,.,k) (7.4. 14) 
其 中 ,约定 Bvo = 0. 根据 各 v; 的 相互 正 交 性 ,用 wi 左 乘 式 (7. 4. 14) 两 端 ,可 得 
ai = VAv; (i= 1,2,.,k) (7. 4. 15) 


记 r; = Ay; 一 及 二 入 3 QiVi, 则 Ti = Bp (假定 有 了 关 0 即 r; 关 0， 否则 产生 中 断 ) , 且 
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| = B, vin = 二 (i = 1,2,.…,k) (7. 4. 16) 


至 此 ,我 们 就 得 到 了 如 下 的 Lanczos 过 程 , 其 中 的 w 称 为 Lanczos 向 量 . 
Lanczos 过 程 : 对 给 定 的 实 对 称 和 矩阵 A: 
(1) 选 择 初 始 向 量 mw, 满足 上 ml; 二 1. 置 B@ 二 0,w==(0. 
(2) 对 i 二 1,2,…,k, 执行 下 列 迭 代 : 
@ 令 ri; = Ayv; —Be Ws 计算 w == (vi,ri)，, 然后 更 新 7; 为 ri 一 Qivi; 
© 置 B |r;l;, 如 果 BB; 3 0 则 停止 迭代 ,否则 置 Van — ri/B:. 
如 果 Lanczos 过 程 在 某 一 步 产 生 中 断 , 即 及 一 D7,|; = 0. 注意 到 此 时 式 (7. 4. 12) 中 
的 uw 二 ri, 因此 我 们 得 到 


AV, Gs VT. (7. 4. 17) 


其 中 , T 是 一 个 i 阶 对 称 三 对 角 和 矩阵 . 若 能 计算 出 T 的 特征 对 (0 ,72 ),， 则 有 4Viy 一 
0.Viy” ,因此 Ritz 值 9: 和 Ritz 向量 x” 二 Viy" 分别 为 原 矩 阵 4 的 最 佳 近似 特征 值 M, 和 
相应 的 特征 向 量 . 这 就 是 Lanczos 算法 的 思想 . 

同样 地 ,Lanczos 算法 的 误差 具有 下 列 性 质 : 


(A—0D Vy = Bely® vn|(A—0D Vy°|,=Blely®|=B|y" | 


其 中 , (9;,y”) 为 T 的 特征 对 , y!” 是 y"” 的 最 后 一 个 分 量 . 

至 此 ,我 们 可 给 出 如 下 Lanczos 算法 : 

(1) 任 取 初 始 向 量 x” ,满足 |x 中; = 1; 

(2) 利 用 Lanczos 过 程 产生 对 称 三 对 角 和 矩阵 T, 假设 没有 中 断 ; 

(3) 使 用 对 称 QR 算法 或 其 他 方法 求 出 T 的 特征 值 即 Ritz 值 90. 宇 9 宇 … 宇 W, 如 
果 需 要 也 可 只 计算 极端 特征 值 9 和 0; 

(4) 适 当 增 加 到 k“， 求 得 T. 的 Ritz 值 9 过 be 宇 … 二 和 . 比较 0 和 0 ， 以 及 
和 0， 如 果 两 者 相差 不 大 ,就 作为 1 和 的 近似 值 ,否则 重复 步骤 (4). 

在 没有 舍 人 误差 的 情况 之 下 ,至 多 nn 步 ,Lanczos 算法 必然 终止 ,因为 此 时 它 得 到 的 
正 交 向 量 组 ,yp，,…,v 已 张 满 整 个 R". 但 由 于 舍 入 误差 的 影响 ,计算 得 到 的 Lanczos 
向 量 很 快 失去 正 交 性 ,对 此 ,人 们 开发 了 各 种 重 正 交 (reorthogonalization) 技 巧 ,有 兴趣 的 
读者 请 查阅 相关 文献 . 


7.4.5 Jacobi-Davidson 法 


最 近 十 几 年 来 , Jacobi-Davidson 法 已 逐渐 成 为 特征 值 计算 的 主流 方法 . 该 方法 基于 
两 个 基本 原则 . 第 一 个 原则 仍然 是 使 用 Galerkin 原理 来 扩张 子 空间 Ki，, 但 在 构造 其 正 交 
基 ,V2 ，…,v 时 不 再 选用 Krylov 子 空间 ,这 个 想法 源 自 E，R.，Davidson 于 1975 年 提 
出 的 Davidson 法 ;第 二 个 原则 是 采用 校正 技巧 ,得 到 相应 的 方程 ,近似 求解 此 方程 后 ,就 
得 到 了 扩张 的 新 方向 . 

为 了 强调 Jacobi-Davidson 法 具有 普 适 性 ,本 节 我 们 将 矩阵 放宽 为 复 矩 阵 . 

设 4E C”™, Ki = span(yiypy ,Vy), Vi = (yi ,VV ), 使 用 Galerkin 条 件 
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AVis — OV:s 加 地 Kr CP 4. 18) 
可 得 
ViAV,s = 0s (7. 4. 19) 
显然 ,计算 出 标准 特征 值 问题 (7. 4. 19) 的 个 特征 对 (0;,s;) 后 , 即 可 得 A 的 & 个 Ritz 对 
(0; ,Visi), 它们 仍然 是 A 的 近似 特征 对 . 
Jacobi-Davidson 法 的 精彩 之 处 在 于 第 三 个 原则 . 这 个 想法 可 追溯 到 雅 可 比 于 1846 
所 做 的 工作 . 假定 Ax == x, 且 uw; 是 已 知 的 特征 值 4 的 特征 向 量 x 的 近似 值 , 雅 可 比 建议 
(他 当时 针对 的 是 强 对 角 占 优 和 矩阵 ) 采 用 ui 的 正 交 校 正 t, 即 有 


A(uit) =Autt), tu; (7. 4, 20) 
由 于 上 上, 故 可 将 子 空间 限定 在 ui, 即 与 w 正 交 的 子 空间 上 . 此 时 算 子 A 在 ui 上 
的 正 交 投影 为 A 在 ui 上 的 限制 
B= (I—uu!r)A(T— wu!) 
注意 到 Au; = 9u;, 即 0; 二 由 Au 因此 
A=B+Auur uu A 一 OU 


将 上 式 代 入 式 (7. 4. 20), 并 注意 到 Bu; = (I 一 uu 了 Aw 一 wufu;) 二 0 及 utit ==0， 
则 有 


(有 一 AT) ri (A—0— ulAt) un; (7.4. 21) 


其 中 , r; 二 (4 一 0.7) wi. 由 于 tLw 且 r; | ww; 因此 式 (7.4.21) 中 右 端 第 二 项 应 该 为 零 
向 量 , 即 上 满足 方程 


(B—ADt=—r; =— (A—0.1)u.; (7.4. 22) 
也 就 是 方程 
(I—uur) (A— A — uu )t =—r., (7. 4. 23) 


由 于 实际 中 4 是 待 求 的 未 知 量 ,因此 最 明显 的 想法 就 是 用 近似 值 9; 来 代替 式 (7.4. 
23) 中 的 4, 这 就 导出 了 Jacobi-Davidson 校正 方程 (correction equation ) 


(I—uut)(A— OD — uu )t 一 一 六 (7. 4. 24) 

对 已 知 的 0, 近似 求解 校正 方程 (7. 4. 24), 得 到 的 可 用 于 扩张 子 空间 Ke,. 这 就 是 
Jacobi-Davidson 法 的 基本 思想 . 
7.4.6 兰 乔 斯 先生 ,请 您 压 阵 


兰 乔 斯 (Cornelius Lanczos,1893 一 1974, 见 图 7-6) 出 生 于 匈牙利 的 犹太 家 庭 ,父亲 
是 一 名 律师 . 1911 年 考 入 布达佩斯 大 学 后 ,物理 老师 厄 特 弗 什 . 罗兰 (Baron Roland von 
Estv6s,1848 一 1919, 世 界 著名 物理 学 家 ,为 纪念 他 ,布达佩斯 大 学 1950 年 起 改名 为 罗兰 
大 学 ) 首 先 让 他 迷 上 了 相对 论 ,数学 老师 费 耶 尔 (Lipot Fejtr,1880 一 1959, 引 入 了 表示 传 
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立 叶 级 数 部 分 和 平均 值 的 费 耶 尔 和 ) 接 着 让 他 学 会 了 传 立 
叶 级 数 、 正 交 多 项 式 和 插值 . 另外 , 费 耶 尔 的 讲课 风格 也 对 
兰 乔 斯 影响 很 大 . 1921 年 , 兰 乔 斯 获得 博士 学 位 ,其 博士 
论文 研究 的 是 麦克 斯 韦 方程 与 泛 函 理论 的 关系 . 他 赠 给 爱 
因 斯 坦 一 本 , 爱 因 斯 坦 读 后 称 赞 论 文 “ 说 理 充 分 且 具 有 新 
颖 的 思想 ”, 并 在 1928 一 1929 年 聘 他 为 助手 . 后 来 他 回忆 
说 ,与 爱 因 斯 坦 合作 的 这 段 时 间 是 他 一 生 中 最 快乐 的 岁 
月 .不 幸 的 是 ,当时 德国 的 社会 环境 使 得 他 被 迫 流亡 美国 . 

1942 年 , 兰 乔 斯 与 人 合作 发 表 了 计算 傅立叶 系数 的 
一 种 矩阵 方法 ,可 是 这 种 方法 直到 23 年 后 才 被 库 勒 
(James William Cooley) 和 图 基 (John Tukey, 1915 一 
2000) 重 新 发 现 , 那 就 是 快速 傅立叶 变换 (FFT) 算 法 . 这 种 
情况 对 他 而 言 已 经 不 是 第 一 次 了 . 早 在 1924 年 ,他 就 发 现 了 爱 因 斯 坦 场 方程 的 一 个 精确 
解 , 其 中 的 重力 场 是 由 尘埃 粒子 绕 具有 圆柱 对 称 性 的 轴 转 动 而 生成 的 , 它 作为 广义 相对 
论 最 简单 的 精确 解 之 一 ,尤其 能 够 用 于 证 明 闭 合 类 时 曲线 的 存在 性 . 可 是 直到 1937 年 ， 
这 个 精确 解 才 被 施 托 库 姆 (Willem Jacob van Stockum,，1910 一 1944) 重 新 发 现 , 并 被 命名 
为 “Stockum 尘埃 ” 

1944 一 1946 年 期 间 , 兰 乔 斯 辞去 普 渡 大 学 的 教 职 , 转 而 在 波音 公司 从 事 飞 机 设计 工 
作 . 新 工作 的 性 质 , 加 上 他 使 用 计算 器 而 不 是 滑 尺 的 独特 计算 风格 ,使 得 他 开发 出 许多 解 
决 问题 的 新 方法 . 1949 年 ,他 加 入 INA, 从 而 深入 地 研究 了 线性 方程 组 和 特征 值 问 题 的 
数值 解法 . 在 这 期 间 , 他 提出 了 Lanczos 算法 和 用 于 计算 gamma 函数 值 的 Lanczos 逼近 ， 
并 对 CG 方法 也 做 出 了 贡献 . 

1950 年 代 美 国 的 麦卡锡 主义 使 得 兰 乔 斯 被 迫 再 度 流 亡 . 应 莅 定 请 的 邀请 ,1952 年 ， 
他 远 赴 都 柏林 高 等 研究 院 (DIAS). 在 那里 ,他 又 一 次 恢复 了 对 广义 相对 论 的 浓厚 兴趣 ， 
并 发 表 和 出 版 了 自己 一 生 的 大 部 分 文章 和 书籍 ,包括 《线性 微分 算 子 》《 古 往 今 来 的 空 
间 》 等 重要 著作 ,以 及 确定 Weyl 张 量 的 Lanczos 势能 和 图 像 处理 中 的 Lanczos 滤波 ， 
等 等 . 

他 的 前 妻 病逝 于 1939 年 二战? 开始 之 前 ,当时 他 侥幸 带 走 了 当时 5 岁 的 儿子 . 因为 
在 1944 年 纳粹 清洗 匈牙利 犹太 人 期 间 , 只 有 他 的 叔叔 和 一 个 侄子 幸免 于 难 . 后 来 , 当 他 
定居 于 西雅图 的 儿子 写 信 报 告 长 孙 出 世 的 消息 时 ,他 回信 说 ,这 个 孩子 的 出 生 * 证 明了 和 希 
特 勒 必定 会 失败 ”. 当然 “ 祸 今 福 之 所 倚 , 福 分 祸 之 所 伏 ”, 正 如 有 人 指出 的 那样 ,如 果 他 没 
有 流亡 美国 ,或 许 当 今 的 应 用 数学 领域 就 会 缺少 几 个 非常 有 用 而 且 优 美 无 比 的 数学 
5 

1974 年 ,他 应 邀 回 母校 罗兰 大 学 担任 客座 教授 . 然而 ,刚刚 返回 故国 一 个 星期 左右 ， 
他 就 因 心 脏 病 突 发 离世 ,享年 81 岁 . 至 此 ,他 终于 结束 了 流亡 生活 . 


图 7-6 兰 乔 斯 (1893 一 1974) 
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习 题 七 
试 利用 盖 尔 定理 确定 矩阵 
1 一 1 忆 
A=|1 5 1 
一 2 一 1 9 


的 特征 值 的 分 布 范围 ,并 对 盖 尔 圆 进行 适当 的 缩放 ,以 确定 特征 值 是 实数 还 是 复数 . 
已 知 和 矩阵 


20 #8 
A=|2 10 2 
人 1 @ 


试 利 用 盖 尔 定理 分 别 确 定 和 矩阵 A 和 AT' 的 盖 尔 圆 ,进而 确定 A 的 特征 值 的 分 布 
范围 . 

以 2 阶 和 矩阵 为 例 , 举 例 说 明 两 个 相交 的 盖 尔 圆 内 ,两 个 特征 值 只 在 其 中 一 个 盖 尔 辆 
内 而 另 一 个 盖 尔 圆 不 包含 特征 值 . 

设 和 A 二 (ay) EE C”" 严格 对 角 占 优 且 对 角 元 都 大 于 替 , 证 明 : A 的 特征 值 的 实 部 都 
大 于 零 . 

设 和 A 二 (ay) EC7” ”严格 对 角 占 优 , 证 明 : o(4) 一 2 max | as 民 

aa 有 | =]1 Ee we 

设 A 二 ( 天 = 本 1 ,求解 广义 特征 值 问题 Ax 一 4Bx. 

设 4=(o)EC” 是 Hermite 纸 阵 , 且 AM 和 Ah 分 别 是 4 的 最 小 特征 值 和 最 大 特 
征 值 , 则 


1.1 


1.2 


习题 答案 与 提示 


习题 一 
提示 :定理 1.1.1 的 证 明 需 分 别 考虑 三 类 变换 ,定理 1. 1. 2 的 证 明 可 使 用 定理 1. 1.1 
及 归纳 法 . 
设 4 = LU, 对 口 做 数 乘 变 换 r, (二), 即将 变换 成 所 求 的 单位 上 三 角 和 矩阵 ,此 时 


Ui 


D =diag(un 9 U22 9 "°° 9 Um 疾 


1 0 0 
(1) 工 一 | 2 ,0 一 |0 一 7 |;P 了 二 了 ,其 余 同 前 ; 
} - 
; 一 1 1 0 0 1 
1 0 0 到 1 0 0 
3 
(2 并 一 > 1 0l,U= |0 误 二 | 二 二 人 | 全 |， 
4 全 
0 = 0 0 -2 上 广 1 
4 3 30 
11 _ 41 
:= 到 2 |; 
2 
0 0 多 
1 0 0 
2 1 1 
(3) aa 一 0 无 LU 分解 ;A 三 4 如 0|; P= Rus E= 3 1 0 
6 3 2 1 
Lo0 1 
6 3 2 
_4 
| 9 一 条 | 
1 
0 0 3 


习题 答案 与 提示 * 343 


a 
1] 
(4) A; 二 0, 无 LU 分解 ;P= Rs;L 一 l ,了 = 0 5 = 
1 E ] 
了 了 0 0 0 


1.4 利用 习题 1. 3(1) 的 结果 , y = (1, 一 7.5,1)?, x 二 (1,1, 一 1)'. 
Q 1 
1.5 A 一 0, 无 LU 分 解 ;P= (， 
1.6 设 4 的 ”> 阶 顺序 主子 矩阵 4, 的 LU 分 解 为 A, = 二 LU,, 将 A 分 块 为 
A, Ai = 记 千 .4 一 
一 上 网 |， 由 于 (4,) = 二 7r(4) = 二 7, 因此 A 的 后 n 一 r 行 可 由 前 7 行 线 性 表 
21 22 
示 , 即 存在 (n 一 7) Xr 阶 和 矩阵 K, 使 得 (hzi,Azs) 二 K(Aii,A1s), 好 Azl 二 KA,， 
Ayz, =KA1,,， 因此 
es 人 O ( ， 区 O | Io “|= bs "| > on 


)'L=U=L 


K 1.)\0O oO KL, LL,)JlIO 0 KL, OlIO JL,, 
此 即 A = LU, 且 工 或 U 是 可 道 和 矩阵 . 
V5 0 0 , ji 
1.7 | 一 天 : 1 U= 天 
l 一 | 5 i | 中 


/5 6 0.5 1 3.5 
| 
1.9 提示 :对 式 (1. 2. 13) 两 边 取 行 列 式 即 可 . 


五 Ol[lL, A 五 A 五 一 4 [到 A 五 一 人 O 
1. 10 ”由 于 一 ， 一 
—B L/LB I OL—B) LO LJIB LL, B I 
因此 
I A [= Bi O 


IL, —A|l/L, O 
民 IL, | 人 | O I,—BA B I, 
两 边 取 行 列 式 即 可 . 当时 , 记 A = 二 a',B=p, 则 |L, 一 po"|==1 一 a'p. 
1.11 设 V, 二 Vi(zi;Zzs,…,z,) 的 道 矩 阵 为 W, 二 (wi ) wy， 则 


C(I Da ds 
(6 — TO (OO) 
其 中 » Ok = Ok (XI1 TX2 ,°° ,Xn) 表示 从 n 个 数 工 1 »T2 9 9 Tn 中 每 取 k 个 的 所 有 可 能 之 
积 之 和 , 且 规 定 m 王 1. 
例如 4 阶 范 德 蒙 德 矩阵 W 的 逆 矩 阵风 : 为 
Laryry 北欧 十 站 看 十 芒 驳 并 寸 码 十 1 
(mm T2)(71 T3)(71 14) (x1 2Z2)(21 ZX3)(71 Z4) (五 zz2)(Z1 13)(71 74) (2 T2)(71 T3)(71 = 


Wi 一 


《zy7 = 1,2,*…,n) 


TT3d4 Xizs TriT4 | zara ZI 十 Za 十 24 ] 
(sz —n1)(z2—zs)(rs —74) (x2 —n)(r2 73)(T2—z4) (wa—n1)(re —z3) (rs —ra) (ve—xi)(r2 —z3)(r2—74) 


T1274 TiT2 Tr1T4 十 z224 T1274 1 
(23 Z1)(zs 12)(z3 ZT4) (x3 X1) (rs zo)(z3 —my) (xz3—21)(t3 = )(73 而 ) (rs T1)(73 To)(73 I4) 


T11273 TiT2 Tr17s 十 T273 天 十 元 十 交 ] 
(7 = (=) $s) (G(s) 【一 而 儿 页 一 矶 ) 交 一 区 ) (zzi)(m —zs)(m—7s) 
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习 题 二 
全 1 1 
2.1 人 让。 二 | # Cay 130, 1,0)T， 
T 性 1 
2.2 (1)P= 0 1 1|; (2)c (一 2,3,1)T,c 为 任意 常数 . 
1 2 2 


2.3 (1) 是 ;(2) 是 ;(3) 不 是 2.4 了 略 . 2.5 略 . 
2.6 必要 性 .划分 A 二 (@i,@s，…,@,), 因为 a; € R(A) 二 R(4B), 所 以 存在 x; € C*， 
使 得 w 二 (4B) x;, 故 
4 一 (aly0，…0) 一 (4ABxi ,4ABx 4Bxr,) 一 4B(Cx ,x,,*…,x,) = ABC 
其 中 , C= Co yx ,x ). 
充分 性 . 设 任意 x € R(4) 二 RC(ABC), 则 存在 y €E C", 使 得 x 二 (ABC)y = 
AB(Cy) E R(AB), 因此 R(A) C R(4B). 同 理 ,对 任意 存在 zx €E C*, 使 得 x = 
(4B)z 一 4(Bz) € R(A), 故 R(4B) CR(A). 于 是 R(4) = R(A4B). 
2.7 设 刀 。，1 十 ho，X 十 有 。， 嫩 十 … 十 hk。x”! 一 0, 任 取 两 两 不 等 的 一 组 数 zi ,zy ，…， 
zx, EE RR, 则 有 
Re*1l 二 ke ezi 二 ka。 十 十 hx! =0 (i= 1,2,.,n) 
记 上 二 (ki,k2，,…,k,)', 则 上 式 即 为 矩阵 方程 Vik == 0, 其 中 冯 一 VCzlyz 
Xs). 由 于 VV 可 道 ,因此 和 矩 阵 方程 只 有 零 解 , 即 &i 一 已 二 … 二 ,二 0. 
2.8 (1) 若 条 件 (a) 与 (b) 成 立 , 而 条 件 (c) 不 成 立 , 则 Pk = 0 有 非 零 解 & = 
(kiskz,°"*,k,)!, 于 是 
kB kB 二 tt, = BB ,BOK = (G00 FH = (G0 ,0 0 =0 
即 记 ,PB ,…,p 线性 相关 ,这 与 条 件 (b) 了 矛盾 . 
《2) 若 条 件 (a) 与 (c) 成 立 ,而 条 件 (b) 不 成 立 , 则 存在 不 全 为 零 的 一 组 数 ,使 得 
请 记 十 已 记 十 … 十 上 8 一 6 
令 y 二 Pk, 这 里 二 (后 DT， 显然 y 二 (yi,y2，…,y)T 了 关 0, 故 
MO Ty0 ty = (0 0 0 )Y = G00 Fe = (BB ,BK=0 


即 @ ,os ，…o 线性 相关 ,这 与 条 件 (a) 了 矛盾 . 
《3) 若 条 件 (b) 与 (c) 成 立 ,而 条 件 (a) 不 成 立 , 则 存在 不 全 为 零 的 一 组 数 ,使 得 
ki@i 十 Ac 十 … 十 ov 一 0 
令 y 二 POk, 这 里 大 二 (CAT， 显然 ?一 (oO)T 尖 0, 故 
YB twp yb, = BB 必 )y 王 (人 0 一 (天 一 0 


即 Bb ,Pp ， "Pb, 线性 相关 ,这 与 条 件 (b) 了 矛盾 . 
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2.9 


S 


12 
2. 13 
14 


Ba 


2.16 


良 


18 


2. 20 


和 
1l1 5 —1 一 1! 1 3 \T 
GD 一 计 | 1 » CO Ca, — LO 和 (4， 3 | 3 
1 1 = 8 
0 0 
(3) 雪 o=| 
零 矩 阵 人 
1 =1 
DP=|1 =1 多 | 
= 王道 “= 一 1 


必要 性 . 设 we 在 两 组 基 下 的 坐标 向 量 分 别 为 x,y, 则 由 x 二 Py 知 Px 二 x 二 1。x. 

由 于 w 天 6, 因此 x 关 0, 故 1 为 矩阵 P 的 特征 值 . 

充分 性 . 设 特征 值 1 对 应 的 非 零 特征 向 量 为 x, 则 Px = x. 令 @ 二 (Qi,@2,…， 

oz)x， 显 然 w 天 6, 否则 x 二 0, 出 现 矛 盾 . 由 于 w 王 (ol ,oz ，…,Q)xX 一 (oly oo，…， 

oo)Px 一 (订户 ,有 xz, 故 x 即 为 所 求 . 

标准 基 为 Ei — Ez ,Es 一 下 3 ,En — En ,Ezs — Es Ei — Ei. 

略 . 

(1) 是 ;(2) 是 ;(3) 是 . 2.15 (1) 不 是 ;(2) 不 是 ;(3) 不 是 . 

GD) 略 ;(2) ( 个 (, 0) dn =2,0= ( Ne “) ,ape R. 2.17 略 . 

Vi Nn Vs 的 基 为 pb; ， 维 数 为 1，w 十 V。 的 基 为 CI yC2 ,Ph 》 维 数 为 3, 

(1) 提 示 : dmw 站 = dimVi 十 dmVz 一 dm(Vi 十 Vy) 之 n 一 dim(Vi 十 岂 2) 之 0， 
其 中 人 三 十 CV, 因此 dim(Vi 十 Vi) 二 n. 也 可 使 用 反 证 法 . 

(2) 设 ol G2,…,@; 为 Vi 的 一 组 基 , 否 有 @ EV 一 Vi, 则 @i ,ts，…,@,,@ 线 性 无 关 
(否则 @ 可 由 @i,@z，…,@; 线性 表示 ,从 而 a € V1, 矛盾 ), 即 dimV; 一 -十 1 过 
rr 二 dimV1i, 与 dimV1 一 dimV; 矛盾 . 

(3) 设 mo EV 且 @i: EV 一 Vi,@ EV 一 Vi, 则 当 @ EV 一 Vi 时 取 @ 二 @; 
当 @; EV 一 Vi 时 取 @ 一 @2; 当 omEV 且 oo EV 时 , 取 w 二 @i 十 @， 则 必 
有 awEVY 一 W (否则 wow 一 w 一 os € Vi ,矛盾 ) 以 及 w EV 一 V， (否则 oz = 二 
0 一 Q@1 E€ Vs, 逆 盾 ). 


ff) = oat art + at et 1 站 器 = 二 类 ) 导 1 二 2£ 一 z3) 


(1) dimU 一 2, 且 U 的 一 组 基 为 f1(1) 一 一 1 十 2 一 如, 户 ( = 一 1 十 2t2 一 3; 

《20 f(D SS Ct fi = (tj 其 由 @ = (二 1,2,0, 一 17Y, 
o 一 (一 1,0,2, 一 DT, 由 于 mw,o,es,el 线性 无 关 , 因 此 (2) = (1,t,2,#) @， 
一 忆 , 户 (GD 一 (ty 民 ) @ 一 与, 故 所 求 为 补 子 空间 为 W = {F) | Fo = 
at2 bt}. 

提示 : Vi = span(@i,@2,… ,Qi1), V2 一 span(P), 其 中 @ 一 (一 1,1,0,…,0)T， 

Gz = (—1,0,1,0,%,0)T ,0 一 (一 1,0, ,0,1)7, 及 一 (1 1 ,1)T 

由 于 | oa ,oz om 有 三 (一 TD)7 天 0, 所 以 mo ,or 线性 无 关 , 且 是 
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R" 的 一 组 基 , 其 中 的 wo ，…a 是 Vi 的 一 组 基 , 有 是 V* 的 一 组 基 , 因 此 R "三 
Vi OV,. 
2.22 (1) 不 是 ,例如 (2,0,0) 关 2 古 (1 ,0,0); (2) 是 ;(3) 是 . 2.23 略 . 
2.24 对 任意 @ 二 i@ 十 ko@; 十 … 十 gs EV, 定义 T(@) = 十 kp 十 … 十 kp,， 
易 证 了 是 线性 变换 . 对 于 i 十 kp 十 … 十 kB, 二 0, 由 于 
一 ATCo) 十 Ta) 十 … 十 To 一 了 (RCI 十 gz 十 … 十 RiC，) 
因此 当 克 可 道 时 ,此 即 i@ 十 kz@z 十 … 十 pos 二 TI(9) 一 0, 结合 on ,as ,on 
是 V 的 一 组 基 , 可 知 & 二 二 … 二 二 0, 即 访 , 忆 ,…,p, 也 是 V 的 基 . 
反之 ,T (oa) 一 8 即 记 房 十 已 记 十 … 十 避 及 一 0, 由 于 房 , 记 …… 及 也 是 V 的 基 , 因 此 
所 一色 一 和 一 包 一 0, 故 wx 一 所 oa 十 忆 oo 十 … 十 po 一 0, 从 而 三 是 可 逆 的 . 
2.25 考察 za 十 zT wx 十 … 十 ziToia 一 0, 两边 做 2 一 1 次 万 变换 ,由 于 Te 一 0， 
i 宇 n, 因此 Tg 十 zz Tg 二 十 TT?m?@g 二 Tm 二 09 即 zx1T'mig 二 0, 由 


于 Tmig 关 0, 因此 xxi 三 0. 类 似 地 ,可 证 xz 二 za 一 … 一 心 一 0. 
0 
0 
Tl(aT apTIC) 一 (Tu TIXC)4A, 其 中 4 一 
1 0 
= 二 二 一 名 
2.26 (1)A=|.2 2 0 |;(2)(—1,0,2)" 及 (1, 一 1,3). 
3 0 2 
下 0 Q 1 0 0 
_ 二 = = ,由 汶 台 
2.27 取 吕 的 一 组 基 Xi 一 (。 |) 2 = (。 1) ,6 = (0); 则 工 在 这 组 基 下 的 
和 矩阵 为 
0 0 0 
和 = | 一 1 二 ， :过 并 
1 一 族 1 
1 二 I 0 0 0 0 
A 的 Jordan 分 解 为 4 二 PJP ,其 中 P=|1 0 一 1|,J= 二 10 0 0|, 则 所 
0 ] 1 0 0 
求 为 
1 41 wt Q = 
Yt yD -天 二 甘 一 ( 1 号 一 各 +% 一 (] y 


2.28 Ker(7) 的 维 数 为 1, 基 为 有 = (一 1, 一 1,0,1)', Im(T) 的 维 数 为 3, 一 组 基 为 
2 一 (10)70s = (—130,1)° ,6s 三 《1, 一 1,177 
提示 : 丁 (el ,es,e3,e1) 二 (i,j,k)A, 这 里 
上 “一 法 1 0 
A= 1 0 一 1 ]1,， Ker(4) 王 span( 有 ,Im(4A) 一 span(ol ,as ,03 ) 
.1 1 


习题 答案 与 提示 347 。 


2.29 


2. 31 


2..32 
2.33 


2.34 


一 3 一 2 一 6 

(1)A= |—11 5 13|; (2) (一 16,5, 一 10)7. 
6 3 8 

提示 : 设 (fi1sfo; fa) 一 (13 玫 ) 有 (gsgoogs) = (lbyt) Pes T (gispys gs) 一 
(£322)B, (gisg2583) = Cfisfas fi)P, Tfisf2sfs) = (fi,f2sfs)h, 则 P = 
PrPyy LT fraps) = 本) PY (EBP = tfi ,A AY 
Pi' BP; "Pi, 于 是 A 二 Pr BP;'P.. 
设 fD=C ETO = yi NT = Ti) r=T (gs 
g2»83) Pa'x = (1,t,t)BPz'x, 因此 y = BPyix. 
(1) Ker(T) 的 维 数 为 1, 基 为 1 十 1 十, Im(T) 的 维 数 为 2, 基 为 1 一 22, 一 1 十 i; 
(2) 不 存在 . 


一 0 
提示 : T 在 标准 基 1,, 娠 下 的 矩阵 为 4 一 | 0 1 —1|,Ker(A)= span(f), 
—1 0 1 
Im(4) 一 span(ol ,oz), 其 中 Bp 二,1,1)T,@ 王 (1;,0, 一 1)T,as 一 (一 1,1,0)7. 
矩阵 4 有 一 对 共 斩 特 征 值 ,因此 4 不 可 实 对 角 化 . 


(1 放生 二 


lL 1 
RK a 工 
3( ); C2) (0 一 4 。 


一 万” 海 
提示 : Ta ‘wm) (,)= Cp ‘B) (7), Tao (7)= Cp By ), 因此 


T (go)F = (BB)G= (a,0)PG, BT (a ,0) = (@ ,oPGF', MM 而 A = PGF. 
PB = (Cam) pi, NT(B) =T ,G2) pi = (0)Api. 
略 . 
(1) 对 任意 a € Vi, 有 TT,(@ 二 T; Ti(@) = 二 TA) 二 A+T;(@), 因此 T,(@) € VW.. 
(2) 由 于 dimV; 之 1, 因此 由 (1), 存 在 数 y 和 非 零 向 量 Bp E V;, 使 得 本 .p 二 yp. 又 
由 于 BE VV, 因此 区 B== 怠 , 故 BE 是 所 求 的 公共 特征 向 量 . 
(3) 对 任意 BE R(T,), 存在 a E V, 使 得 二 本 a, 从 而 
TBP=Ti(Ts0) = (TiT)a= (TTi)a=T,(Tia) € R(T,); 
对 任意 @ E N(T,), 有 T 丁 ;(@) 一 0. 从 而 
TTia) = (TTia= (TTT)ea=T (Ta) =T(0)=0 
故 Tiw € N(T,). 
4 的 特征 值 为 4,2,2, 特征 向 量 为 p; == (1,2,1)7, ps 一 (0,1,0)T， ps = 
(一 1,0,1)7, 因此 所 求 为 
Vi = span(pi),V: = span(p;),Vs = span(ps) 及 Vi 二 +V,,V 十 V3,，V2 十 V3 
并 且 R = VOV: OV. 
1 2 0 1 0 二 凡生 3 一 0 
(1)P=| 0 1 0|,J=|0 2 0|;(2)P=|1 1 ll;J=|I0 1 
=1] 三 多 日 @ ={ 1 一 六 一 0 0 


Mis 
1 
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2.36 


2.38 


2.39 


2.40 


2. 41 


2. 42 


3.1 
3.2 


3.3 


1 3 1 1 IT 而 1 站 江 0 1 0 
(WP=|—1 -2 0l,J=io 1 1 CDP=| -3 0 0,J=|0 0 0|. 
一 1 一 1 +t 6 6 1 一 2 0 1 0 0 0 
A; 的 Jordan 标准 型 为 PL4AiP; 二 J; (i 二 1,2 ), 其 中 
0 10 = 
= 人 小 = 人 ,=|oo il 大 = 0 = , 
一 4 0 0 一 1 
2 0 0 0 站 一 1 


因此 A 的 Jordan 标准 型 为 PT4P 二 J ,其 中 P= diag(P,P,), = diag(Jh ,J;). 
X1(t) =— EGC 十 C 十 @ 十 Ca 一人 (CI 十 2C 0 ,zx 一 ez(C 十 CD， 
其 中 CC, CE C. 
4 的 特征 值 为 三 2 (三 重 ) ,计算 可 得 六 三 3 一 1m2 = 二 ns 二 0, di 二 2,d; 二 1,d; 一 
0, 0 = 1,6, = 1. 
令 B==A 一 21, 由 于 户 二 0, 故 取 pi 二 (1,0,0)7, 则 长 为 2 的 Jordan 链 为 
{pi = (1,0,0)7 ,Bp = (一 6, 一 12, 一 6)7) 

取 ps 一 (2,0,3) 满足 Br 二 0, 则 男 一 个 长 为 1 的 Jordan 链 就 是 为 {p,}. 
证 明 有 阶 Jordan 块 JQ) 与 QQ) 相似 即 可 .事实 上 , 取 P= (e,e: 1,…,e), 其 中 e 为 
和 阶 单位 矩阵 五 的 第 i 列 , i 二 1,2,…,k, 易 知 P1JOWP= QO). 

1 二 雇 直 妃 

= 4 42 

0 0 = 名 
设 p00) 二 |X 一 A 二 让 十 giX" 十 … 十 an 十 oo. 因为 4 可 逆 , 所 以 wm = 
(一 1)*|A| 关 0. 由 CayleyHamilton 定理 ， PC4) 一 4 十 0 1 A 十 … 十 qhA 十 aoT = 二 
O, 因此 


4(4 十 ar 4 十 … 十 aiD 二 一 aol 


从 而 所 求 即 为 
A = dD = Da A 
a nl 1 ~ TAT Ql Qi 了 ) 


分 别 为 m2) 二 (一 222 和 (OA) 二 0 一 3)Q 一 1). 
习题 三 
eC—4,0, 一 30 0 和 和民 。 
考察 RICI 十 AzCs 十 Lh 十 Lp 一 0， 两 边 分 别 用 CI yC2 做 内 积 , 注 意 到 《0 万 ) =:0 
(i,7 二 1,2), 则 
Ri(@i,01) TR (Gi, G2) = 0, ki(g,0) Hh (Gs 0) = 0 
根据 Cauchy-Schwartz 不 等 式 , 此 方程 组 的 系数 行列 式 D = (ol ,ol)(as ,02) 一 
(ol ,02) 之 0, 且 当 @i,@z 线性 无 关 时 等 号 不 成 立 ,因此 DD 二 0, 解 得 = ks 二 0， 
从 而 LB 十 LB; = (0. 再 由 h ,Pb 线性 无 关 可 知 4 一 /一 0. 
正 交 基 为 gil ,oz ,os 一 (一 1,0,1,0)T,o 一 (0, 一 2,0,1)7, 标准 正 交 基 为 
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a = 0 D0 = ,0DT 8 = C100 = 00,—%0,17 


a2 V5 V2 #5 
3.4 设 二 阶 正 交 和 矩阵 A 二 人 站 ), 则 DD 二 |4|=ad 一 & = 士 1, 且 
rata, Td 7 


当 吕 二 1 时 ,显然 a 二 4,6 二 一 c 且 a 十 二 1. 令 4a 二 cos0 (一 x 过 0 过 7), 则 
b= sing, c 一 一 Sin0, d = cosb 

当 刀 = 一 1 时 ,显然 a = 一 4,6= 二 cc 且 a? 十 扩 = 二 1. 邻 a 王 cos0 (一 x 过 0 过 7), 则 
b= sinb, cc = sinb, d 一 一 cosO 


a 站 
多 5 和 -可 -可 
3.5 (1)O=|1 0 0 |,R=|0 5 2|, 
3 4 0 0 1 
2 济 瑟 
2 V2 二 
wn 
= 二 二 和 日 
2 一 | 万 万 
2 
0 翅 0 0 
V6 
1 2 2 5 1 2 
(3)QO=|2 1 —1l,R=|0 1 —1|, 
一 部 了 0 0 0 
重 重 
A2 2 dE 2 0 
WO= |1 _1 slR=| ogo of 
V2 V2 0 0 1 
0 0 1 


3.6 由 例 3. 5.6 可 知 式 (3. 2.7) 不 正确 ,正确 的 结论 是 4 = OCR, X). 

3.7 (1) 不 是 ,正定 性 不 满足 ;(2) 是 ;(3) 不 是 , 齐 次 性 和 可 加 性 不 满足 .. 

3.8 证 明 略 . (zi 十 2z2y 十 下 十 yy) 去 (好 十 2 好 十 … 十 720%)(Y 十 2% 十 … 十 nny?) 
3.9 提示 :计算 AB 和 BA 的 对 角 元 .， 3.10 略 . 


3.11 (1) 由 于 w 一 地 + bs0 ——3p 十 二 育 ， 则 


1 1 

(om) = (m1 — Fh + )= 2, (a0) = (a, > 有 FB)=1 
加 加 3 1 

Ca) 一 (oo) 一 1， (a0) = (m2, — Tht)=2 


因此 4 一 人， 站 由 于 (Bi ,PB) = (ol ,as )P， 其 中 P 一 ( 省 


), 故 
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人 


.12 


13 


.14 


. 15 


.16 
.17 


18 
19 


.20 
.23 


24 


.25 


B 一 PrhP 一 人 | 
12 426 

(2 gm = CL 1 es = 

必要 性 . 因为 房 , 记 ,及 的 度量 矩阵 B = PTAP, 又 忆 ,Bp,…, 忆 是 V 的 标准 正 交 
基 , 其 度量 矩阵 应 为 吾 一 工 所 以 PTAP 一 工 

充分 性 . 由 于 PTAP 二 1 因此 房 , 记 ,…, 及 是 Y 的 一 组 基 , 从 而 其 度量 矩阵 为 了 一 
PTAP, 因此 B 一 了 即 记 ,Bp,…,p, 是 V 的 标准 正 交 基 . 


] 二 
3 1 4 2 
度量 矩阵 C= 王 | 1 ye 1) Ie Fl) | 可 逆 , 因 此 函数 组 zer ,ze 线性 
1 vA ] 2 
区 一 多 je i fe Ly 


(2) fi =1,f2 一 2V3 (zx 一 去 ),fs 二 6V5 (x 一 zx 十 去)， 


(3) fi =1,f; =x—1,f= 坟 2 


3 ( El 二 2e2 | 2s3 ). 


(DD) 设 @ 三 oil 十 io 十 …… 十 os 天 0 不等式 两 边 用 w 做 内 积 , 则 0 尖 0 ,矛盾 ; 
(2) 显 然 (a 一 pB,Y) 二 0, 再 利用 (1) 的 结论 . 

提示 : @ 二 Co)o 十 … 十 (@0)0 ,B= BBB +…+ (Bp,B)B,. 

设 wo 0 0 ，… ,0 为 欧 开 空间 V 的 一 组 标准 正 交 基 . 


n 上 n k 
(1) 由 Parseval 等 式 可 知 ol 二 >， (oa 一 > Go) > (o> > (xx)2; 
i=1 i i i=1 


大 
(2) (yo) = (0) — Dao) 0 0) 一 (oo) 一 (oo)(oo) = 0. 
j=1 


户 一 (2,2,1,0)7, 慌 二 (一 1, 一 1,1,0)7.。 3.21 提示 : Vi 一 span(&).。 3.22 上 略 . 
若 有 任意 wE (Vi 十 V2)+, 则 @ | (Vi 十 Vi). 对 任意 PE 太 ,由 于 W CCV 十 
V2), 因此 @ | , 即 @€ Vi. 同 理 wm € Vy, 因此 gE€ Vt 人 门 Vi; 反之 ,对 任意 
a EVL 站 Vi, 有 EVi 且 Vi, 故 a | Vi 且 @ | Vi. 于 是 @ | (Vi 十 V,), 此 
即 wxE (Wi 十 Vo) 二 .在 (Vi 十 V;) 汪 二 VL 败 Vz 中 分 别 用 WL 换 Vi, 用 Vi 换 V， 
即 得 (Vi 站 V2)t+= Vt 十 Vt. 
B=,31,0 ,B= C2,3,0,DT 以 及 = (2,1,—1,D',%m 一 (1 一 2, 一 1DT. 
(1) 反 证 法 . 假设 dimN(4) 门 RGA) = 1, 则 对 任意 非 零 向 量 x € N(A) 门 RCA)， 
有 xEN(A), 即 Ax 二 0. 
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Ey 


ww 


26 


27 
28 


.29 


30 


下 


32 


33 


34 


.35 


.36 


38 


39 


把 x 扩充 为 RC(4) 的 基 x;@s,…,@,, 则 RC(A) 二 span(x,@2，… ,0;), 从 而 
R(A?) = AR(A’) = span(Ax,Aa;,…,Aa,) = span(Ag,,*…, Aa,) 

即 dimR(4:) 过 nn 一 1, 于 是 dimR(A?) 一 r(h?) 关 7r(4) 二 7, 出现 矛盾 . 
(2) 由 (1) 及 dimN(4) 十 dimR(A4) 二 nn 即 知 结论 成 立 . 
必要 性 . 因为 Ax 二 b 有 解 , 因 此 x"A"y 二 b"y. 注意 到 y € N(4"), 因此 A™y 二 0， 
也 就 是 六 7 一 0. 
充分 性 . 由 于 4ay 二 0, 因此 yE NGC4H) 一 R(A)+. 而 由 by 一 0 可 知 y》| b, 因 
此 bE RC(A), 即 线性 方程 组 Ax 一 已 有 解 . 
(1) 结 果 都 是 x 一 (2,0)7; (2) 都 无 最 小 二 乘 解 ;(3) 结 果 都 是 x 二 (2. 5, 一 0. 5,3. 5)7. 
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>” 14 六 181™ | see 181’ 
多 19 1 入， 鹤 
(Dy y 1 


不 是 正 交 变换 ,因为 MM 不 是 线性 变换 . 
(To),TCo)) 一 (aa) 十 Eu:oo)2(02 十 RCooyoo))， 因 此 万 (w) 是 正 交 变换 当 且 
仅 当 2 十 RCao ,00) 一 0， 计算 可 知 (Cn ,00 ) 一 起 十 22 十 … 十 722. 


取 7(os) 一 寺 (@ 十 20s 十 2@s) 即 可 . 

易 知 必要 性 . 设 7(wi) 王 房 , 由 习题 2. 24 知 , 厂 是 符合 本 (@;) = pp 的 唯一 线性 变 
换 , 因 此 (7 (ai ) ,了 (a; b= (Pp ,Bb;) 二 (CC ,0; ) 

对 任意 op EV, 设 w = ki@i kz 十 … 十 Rn， B= ol 十 /202 SE ss ot bis 则 


n nn 


(a,P) = (ki@i + kzQs "1 PC Li 十 lo "+ LQ ) 一 >， kilj (Qi ,0; ) 
1 


i j= 


(TTB) = kT) TR Te) Th TUT) Tm) t+: 


thTE)) = ORT GE) Tm)) 一 > Dl (0 ,0) 
t=1 i=1 j=1 
因此 (TT(@,T(B) = (a,p). 
对 矩阵 Cj (0), 仿 Hi 王 工 一 2xxT, = 1 一 2w!,， 其 中 
革 


he (OO0vsin ,0,°,0,c08 O ,0.7,0) 


. 
» = (0,°%,0,sin ,0,..,0,cos 30,0,...,0) 

计算 可 知 G; (0) 一 五 > Hi'. 

提示 : 设 百 王 T 一 2 , 则 吾 一 T 一 2207 ,其 中 本 一 (rar;00DT, 且 | 一 | 
一 也 

提示 : 设 H 二 1 一 2uu', 则 GHG™' 二 I 一 2(Gu) (Gu)T, 且 | 上 Gu|= ul=1. 
类 似 地 , HBH = 1 一 2(Hw) (Hw)", 且 |Hu|= |ul=1. 

咯 . 3.37 提示 :直接 计算 右 端 即 可 ,注意 (@,ip) = 一 i(@,), (BQ) = i(p,@). 
提示 : 即 证 y"(4" 一 B)x 一 0. 注意 若 A4 = (4j)wa, 则 elhe; = a;. 

略 . 
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Lu 


+ 


. 40 ”计算 可 知 UNU== (4'A4 十 BTB) 十 i(4'B 一 B'A), RiIR= 


上 


AIA 十 BrB 一 4TB 十 BTA 
4TB 一 BIA 4T4 十 BTB | 
因此 和 矩阵 UU 是 酉 矩阵 的 充 要 条 件 是 A'A 十 B'B 日 A'B = 二 BT'A, 也 就 是 矩阵 R 是 
正 交 和 矩阵 . 


.41 必要 性 是 显然 的 . 下 证 充分 性 . 对 |zw 十 up|== zzz 二 1zz| 两 边 平 方 并 化 简 , 即 


得 ReC(za ,wp) = |zal: |wpl 
注意 到 | zc| |wp| 大 | (zg,wp)|, 故 Relza ,wp) 之 | (ze,u$B)|. 由 zsw 的 
任意 性 ,可 知 (g,P) = 0. 


.42 5= 且 人 汪汪 全 了 


2 


sk Ns 


习 题 四 


.1 设 x 为 单位 特征 向 量 . 由 于 A 是 正规 矩阵 , 故 可 将 * 扩充 为 西 矩阵 避 一 (x,ws，…， 


tl )， 使 得 A 的 谱 分 解 为 4 = UAU, 其 中 A = 人 于 是 
AHx = UAU x 一 UAe = (xjart …D)el = Ax 


2 略 . 4.3 由 例 4.1.4, 对 k&,! 使 用 归纳 法 . 

4 提示 : 设 B== zh 十 wA", 直接 验算 BB 一 BB? 成 立 . 

5 提示 : 设 B= A 一 证 , 直接 验算 BMB 一 BB" 成 立 . 

6 提示 : 设 A 的 谱 分 解 为 4 = UAU™, 其 中 人 = (iv)， 则 由 习题 4.1 可 知 ， 
AHU = UA. 

7 提示 : 设 A 的 谱 分 解 为 4 一 UAU?, 则 4A? = 二 UAU™. 由 4 三 42: 可知 和 一 4 , 即 


必 一 0 或 1, 于 是 A = A. 


.8 计算 可 知 454 二 (BNIB 二 CO 二 ;COBEC 一 CHB), 44H = (BB CCH) 一 ;COBCH 一 CBH). 


必要 性 .由 A"4 一 445 知 BC 一 CB 一 BC 一 CBE 又 B8 一 BC 一 C, 故 BC 二 CB. 
充分 性 .由 BC = 二 CB 及 Bn" 二 B,C 二 CC, 可 知 BCH 一 CBE 一 O 王 BCH 一 CBE，, 目 
BHEB 二 CC 一 有 2 十 C2 = BBCCH, 从 而 AA = 4AA4H， 


.9 提示 :4,B 的 谱 分 解 分 别 为 4 二 UAU", B = UDU™, 其 中 


A= (A1 SA2 9 An), 也 一 diag(d! CD 2) (dt ee Ai i 一 1 ,2，…,7) 


.10 一) 十 srt 下 ,其 中 


T 
Al = UT A 一 一 2V2 ,wu == (12, = 1) sw 一 去 (2 ,= 1 


.11 提示 :对 整数 & 使 用 归纳 法 . 4.12 略 . 


13 ”必要 性 . 4B 一 (4B)" 一 BHA4AH 一 BA. 充分 性 . (4B)a 一 BA 一 BA = 4B. 


.14 ”提示 :充分 性 . UM"AU = A, ViBV = D, 有 是 A 二 D. 故 存在 西 和 矩阵 = UV ,使 得 


WAW = B. 


. 15 充分 性 . 对 任意 x,yE C”, xiAx、 yAy 和 (x 十 yyHA(x 十 y) 都 是 实数 ,因此 > 一 


x Ay 十 ynAhx 也 是 实数 . 取 x 一 ej，y 一 e,， 则 > 一 ax 十 ay EE 民 ， 即 元 素 Qjk 9 Og 
的 虚 部 互 为 相反 数 ; 取 一 ie; ， 一 6Ek， 则 之 =— 十 iag ER, 即 元 素 Qj Og 的 
实 部 相等 . 因此 及 交 二 ay ;BRAS A, 
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4. 


二 


16 


17 


18 
19 


20 


21 


.22 


23 


.24 


.25 


26 


.27 


1I 十 U| 关 0, 否则 一 1 为 UU 的 特征 值 . 由 于 (I 十 由 (一 中 二 (I 一 U) (IT 十 U)7 

且 UMU = 也 因此 

HE8 一 一 ;GT 十 UD GI 一 Da 一 一 ;GT 十 DO 并 一 D) 一 一 OU 十 UBmCO8U 一 D) 
= 一; (U 十 DCUHTUHECU 一 站 一 iT 一 D) GT 十 DD) =H. 

同 理 , |1 一 这 | 二 | (一 站 ( 百 十 节 )| = | 百 十 这 | 夭 0, 否则 一 i 为 H 的 特征 值 ,这 

与 Hermite 和 矩阵 H 的 特征 值 为 实数 相 矛 盾 . 由 于 (I 十 iH)(I 一 i:H) = (I 一 iH) 

(十 再 ) 上 且 HY == H, 因此 

UU =(—iHD OHDOTH) OiH) =(HiH) (iD UT (UiH) 
= (I+iH)2 (+iH)(I—iH) (I—iH) "=I 

|I 士 4| 关 0, 否则 士 1 为 4 的 特征 值 ,这 与 反 Hermite 和 矩阵 4 的 特征 值 为 纯 虚 数 

相 了 矛盾 .注意 到 (I 一 A) (I 十 A) = (I 十 A) (I 一 4), 因此 

CHC =(I+A) FA) (I—A)T (1A) =(—A) (+A) (I—A) I+A)! 
= (I—A) (I—A)(I+A) (I+A) =I 

而 CI 二 (1 一 4) (I 十 4) 十 (I 十 4) (I 十 A) 三 20 十 4 和) 故 |1C 十 直径 0, 即 

一 1 不 是 C 的 特征 值 . 

提示 : 即 证 S$ = CI 十 4) (GT 一 4) 是 反对 称 矩 阵 ， 

提示 : A 是 实 对 称 和 矩阵 , 故 存在 正 交 和 矩阵 Q 和 实 对 角 和 矩阵 A, 使 得 CO 1AQ 二 A, 即 

4 一 CO40 1. 再 由 4 一 4 可 知 42 = 二 A, 即 4; 二 0 或 1, 于 是 存在 整数 ~, 使 得 4 一 

diag(L, ,DO). 

提示 :存在 正 交 和 矩阵 8 和 实 对 角 矩 阵 A, 使 得 CO AQ 二 A. 再 由 A? = 二 1 可 知 A? 一 

1, 即 4; = 一 1 或 1, 于 是 存在 整数 ~, 使 得 A 二 diag(I,, 一 了 ,). 

设 A 的 谱 分 解 为 4 二 UAU", 则 A* 二 UA*U" 二 0, 因此 A* 二 0, 即 , = 0, 于 是 

A 二 0, 即 A 二 0. 

A 王楠 十 wusl 十 Nusuil ,其 中 


Ai = 1] ,A» = As = 3U1 一 区 0 本 [DR = C20 LY sls = (OE 0) 


对 任意 YE C", 有 x"ArAx 一 |Ax|’ 宇 0, 是 14x|? = 二 0 当 且 仅 当 Ax 二 0, 因为 
A 列 满 秩 , 此 即 x 二 0. 
由 于 A 之 0, 故 存在 可 道 矩 阵 @ 使 得 4 = CO80, 因此 

0= | —A4B|= | —Q"0B|= 10 .一 OBO8 10| 
故 4B 与 QBQ" 的 特征 值 相同 . 由 于 QBQ* 是 Hermite 矩阵 ,特征 值 为 实数 ,此 即 
AB 的 特征 值 为 实数 . 同 理 可 知 BA 的 特征 值 也 为 实数 . 
设 A 的 谱 分 解 为 4 = LUAI 太 ,由 于 4 二 0, 故人 4 的 对 角 元 ); 三 0. 又 由 4H8A 一 
UA?U? = 二 了 可知 A? = 二 了 ,此 即 = 二 1, 也 就 是 4 一 大 于 是 4 一 DUIUH 一 工 
由 A 和 4 宇 0 可 知 4 的 特征 值 A; 三 0, 于 是 1 十 4 的 特征 值 1 十 三 1, 故 I 十 A 的 所 
有 特征 值 的 乘积 不 小 于 1, 即 1|1 十 4| 宇 1. 显然 等 号 成 立时 I 十 4 的 所 有 特征 值 
都 为 1, 即 4 的 所 有 特征 值 都 为 零 , 故 A = 0. 
设 4 的 特征 值 为 丸 ,…,h， 则 A 十 械 的 特征 值 为 入 十 ty…,h 十 t， 取 1 二 
max{| 和 | ,…,|,|}, 则 4 十 丰 的 特征 值 全 为 正 数 , 即 4 十 左 之 0. 类 似 地 ,存在 


和 矩阵 分 析 与 计算 


由 于 4 之 0, 故 存 在 可 首 Hermite 和 矩阵 百 , 使 得 A4== HH, 因此 HABH = 五 :1B 末 
二 HIBH, 即 矩 阵 4B 与 矩阵 HIBH 的 特征 值 相 同 . 由 于 召 二 0, 故 可 得 BEB 末 之 0， 
从 而 HNBH 的 特征 值 全 为 正 数 ,于 是 4B 的 特征 值 全 为 正 数 . 注意 到 4B 是 


对 任意 a EV, 有 Pla) €E R(P), 设 a 二 Pl@) 十 @, 则 P (@) = 二 Pi(@g) 十 P(g;) 


4.32 上 略 . 4.33 略 . 


设 投影 矩阵 己 的 谱 分 解 为 王 王 LAU , 则 由 P 了 二 忆 可知 A 二 A?, 即 A 二 0 或 1. 
由 42 一 4,B 一 B 及 (4 十 B)* 一 A 十 B 可知 AB 十 BA 一 O. 从 而 
A’B+ABA = AB+ABA =0O,ABA+BA’=ABA+BA=0O 


由 A 二 A4,B? 一 B 及 (4 一 B)* = 一 A 一 B 可 知 4B 十 BA 一 2B. 从 而 
BAB -+BA= BAB+BA =2B = 2B,AB’+BAB 一 4B 十 BAB = 2B 一 2B， 


* 354 。 

Qe min{ | 站 | sy Ls | 站 使 得 A 一 机 二 0. 
4. 28 

Hermite 矩阵 ,因此 4B 二 0. 
4. 29 因为 HT 一 H 有 ED, = |H| 计 0,k=1,2,.…,n. 
4. 30 

=P(g)+P(g;,), P(g;) = 0， 即 2 EE N(P). 
4. 31 ”提示 :证 明了 I 一 P 是 短 等 矩阵 . 
4. 34 
4.35 ”由 上 题 ,并 注意 到 R(4) 门 N(4) = 10). 
4.36 即 证 G = 二 uiu? 是 Hermite 和 矩阵 和 和 究 等 矩阵 . 
4. 37 

两 式 相 减 ,得 4B == BA, 因此 AB 一 BA 一 O. 
4. 38 

两 式 相 减 ,得 AB = BA, 因此 AB = BA==B. 
4.39 (AB)’: = A(BA)B = A(AB)B = A:B’ = AB. 
4. 40 求 矩 阵 4 的 完全 SVD 和 约 化 SVD, 其 中 有 为: 


一 外 Wd Wl {人 i 注 ==1 
中 如 | 二 ol 1 ol. 友 | 。 Vz 0 | , 约 化 SVD 与 完全 SVD 相 同 ; 
ly 0 woo .gg 一 上 
1 v2 _ 1 
V6 2 3 
V3 0 | 
c| 工 好 Lo 1|. 受 ( 上 
人 从 -一 9 
着 电 V3 1 1 
0 0 
2& 0 1 
V6 V3 
1 - 壮 
/6 2 
1 |.W3 0 a 
‘* 想 2 1) 2 1 
2 
= 9 
‘8 


Cn 
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4. 42 


4. 43 


4. 44 


| 
5.6 


2 
0 
V6 i 
15 0 
(3) -| 0 ol . 革 (_- 时 
V6 2 V5\=2 1/° 
0 0 
1 2 
/6 2 


so Hl- Ht Hr HH HE 


ee ed 天光 9| 志 0 0 
| 人 小， ja in 小 
0 1j lo o0 0 
2 0 V2 0 
0 1\l2 0 0| vs 0 1\[2 01 /zs 
G5)() ojls a ol "ls 中 可 到 a 


设 方 阵 4 的 SVD 分 解 为 4 = UBV, 其 中 允 == diag(olo ,ao) 的 对 角 元 全 为 
正 数 ,注意 到 西 和 矩阵 的 特征 值 为 十 1, 故 detA = detUdet5detV 二 十 o10,…o,， 即 
| detA| = oo on 
由 于 BNB 二 VHAMUHUAV 一 Vi(ANA)V, 因此 BNB 与 4nA 西 相似 , 即 它们 的 特征 
值 相同 ,也 就 是 4 与 B 的 奇异 值 相同 .车 4 的 SVD 分 解 为 4 二 U5VH, 则 B 的 
SVD 分 解 为 B= 二 (UU,)BViV). 

we 下 _ OB olf0 WW 
提示 : 设 A 的 SVD 分解 为 4 一 Uzv", 可 考虑 B= (0 0) | | | 
设 A 的 SVD 分 解 为 A 人 UDVi, 其 中 对 一 diag(oi ,02，… On )， 这 里 of ,08 ,*** 02 
是 A 的 nn 个 实 特征 值 , 且 o 宇 02 宇 … 宇 6 宇 0. 因此 A = UBWF = (U5 
UF CUIVE) = (VIVID VEVID). 仿 U=UVi, B=0BUr,C=VBWVH, 则 U 是 
西 和 矩阵, 且 B? = UUt = AA",C = VVt 一 AH4. 


习 题 五 
8, V30,5. 5.2 略 ， 5.3 略 . 5.4 上 略 ， 5.5 略 . 
Dlxh < lal<nmxlz|=nlxls, lxls = mxl zl < 1a)’ = |xli, 


| zx 性 一 2 zl <lxls = (1) 一 zl 
1 1 


1 1 
Dx < ll <lxl,, lxli= 2 :zi| <n max| zi|’<nlxls; 
n i 
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(3) | zl 


i 一 2 [zi|’ < max| zi| 2 [zi| = lxl, xh. 


5.7 略 . 5.8 上 略 . 5.9 15, V33,12,8, V5 士 V1l7,6 
5.10 (1) 对 任意 xE ,有 x|l==147C4x)| 壹 14 14x|, 特别 地 , 当 Ax 一 Mx 时 ， 
zl= 147C4x) 有 之 1494 zl 此 即 41471 了 过 141. 另外 有 |4| 过 
0(4) < lal. 
人 [AT'x| _ > = |x| 
(2) |47| max max fl A y 了 一 4x ) 一 EPE 


| x yA0 


5. 11 提示 : pn Re el 

5.12 14-|，。 a) = d= 

5.13 |vuls oe 一 和 (CD =1. 

5. 14 (1) 因为 Px 仅仅 是 重 排 x 的 各 分 量 的 位 置 , 因 此 | Px|, = |x|,, 从 而 
1P|， = mex | — I 


(2) 设 d= 二 max|q;|, 则 |Dx|? = 2) |dizi|?* 过 qr*》)|zi|?*, 从 而 


Ipl, = max =a. 
5.15 A 中 列 和 最 大 的 那 一 列 显然 就 是 4a 中 行 和 最 大 的 那 一 行 . 
5.16 提示 :(1) 14|; = ww(CAHA) 去 2 (ANA) = tr (A"A) = |Al?, 


|Al$ = Xm (AA) = 2 (ANA) = 2 < reof=r. |Al?; 


(2)141,= ND [a [je >) 2 ay)| 
§ j=1 


Ed y=i 


= lal Sn max "2 a;|)=n. |Al, 
ah = max(P al)< > 
= Dll. mex em 
A= Dol <D DI) <n (melasl) =n. 1al?, 
al = (mgx al) < 3 (Dlesl) 


> [ty 全 lu] 六 as|? = m|Al?; 
Al = SDI < Pla) <m (ma lel) =m: 


;1 下] 


[als = (max2; lal) < 2 (2 lesl) 
i j=l i=l j=l 


4|2， 


S. 17 


S. 18 


S. 20 


S. 21 
S. 22 
5, 23 


S. 24 


$5.25 
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= DEDD: Dll) 7D De = nal 


j=1 


(5) 14l; 三 14ls 志 VmlAl|。. 另外 ,由 习题 5. 6 可 知 去 上 xl <|xls< |zlls, 
n 
14x|。 laxl: _ 
因此 141。= max fxr] Synmax frp, 。 VnlAl;; 


(6) 41 二 14ls 志 Yn14hi. 由 习题 5. 6, |x); 过 |xli 志 Vn|xl;, 注意 到 Ax E 
[Axli : |Ax|; 
fx < Vmax fry, = vm|Al;. 


| 


Cs 故 IAli 一 Max 
略 . 


(GD) |Ax| ,= max| > wzi| 去 < md la sl< Smex dT | mgxls 5] 
i j=l 


Ea (max>) | 志 ) (max|z; | ) 委 Lmax(2 。 max|a; |)]* (max|z; | ) 
i j=1 了 1 sR J 
nmax|lay|)* (max|z;|)= |A|, |xl.. 
bj 


GD eh = asl< DY olsl< [IDs) (D1s))] 
= (2 31d) (1s)= Al hah. 


ahi= > | Des) < DPI. Dlsl’) 


= ) 1s 上) 过 mo + max|as|’* x| 
i=1] j=1 i 
= f°(4)|xl?; 
(3) [Ax|$ < rm: maxla;|? » |zxli < [maxGnsm] »: max|a;|? . |x|i = 
1 1 
82 (A)|xl?, 


| axl2 < max| 2 arr |< max>) |ax | zi |< (max 之 ， lax | ) (max| zw|) 


从 


(ne. maxl ai 上 zl 入 [maxGn,n) 。 max| or | x= g(A)| x|,. 
alAls= a 站 fx 14z1 .< 141| = ax, La mex,lAxl,= clAl.. 

略 . 

上 4 性 一 和 oha4) = ph"A) 过 |4a4l 过 As 14) = 14 14 

[UAN? = XL (UA) UA)] 一 MsCA8A) 一 1 4， |Av|; = | GD, = [viAN|, 
一 14"1, = 14|;，, 其 他 类 似 可 证 , 略 去 . 


| xy: = a Nw Cry™)zl, 
2 
= mx x | 下 | Ia ,1y"z|= |xl:|yl;, 
| xy。 一 max [ogrel = | xl。 max yz|= |xlslyl. 


| zl 。 1 zl 。 
设 B= (bi,b,,… "shi)s 显然 Las.) < Talslbls, 因此 
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wm 


20 


27 


28 


.29 


| 


14B | = lab, ls < 14 > bli = = |Al2lBlz. 


同时 |aBl; = | 4B)"|: = | Ba4a| ,二 | Ba:aalz = |B|;,|Als 
(1) 设 4 的 Schur 分 解 为 4 王 UTUE , 则 工 的 对 角 元 为 1 ,2，… .由 下 范 数 的 本 


不 变性 ,有 14 = 1oTUalz = |T|: 二 到 | 乱 ]. 


易 知 等 号 成 立时 矩阵 工 为 对 角 矩 阵 , 即 4 为 正规 矩阵 
(2) 显 然 Ar4 刻画 了 和 矩阵 A 偏离 正规 矩阵 的 程度 . 
x lAx| 
利用 习题 5. 10 的 结论 可 知 <(4) = 14|， [a= eT. 当 4 是 正规 矩阵 


lxll=1 


时 , x2(4) = Al 1471: 一 1DBVe :Ive v0", 一 12 121 一生 一 


max |A| 
AEa(A) 
min | 人 | 
AEo(A) 
利用 习题 5. 16 中 的 结论 (5) 和 (6). 
(1) 提 示 : 设 4a 一 max |as|, |xl: 二 1, 计算 14|3 一 x"A"Ax; 
sj 去 
(2) 提 示 : 利 用 p(4) 三 14l; 入 > ,ax la;|, 可知 e 过 上 4|; 过 2e,e 入 141， 
过 2s ,从 而 1 和 受 心 (4) 委 4. 
习 题 六 


略 .， 6.2 上 略 . 6.3 0) 收 化 ,A 的 特征 值 为 己 和 一 方 ; (2) |4 = 0. 8. 
A 0 和 a，, 因此 当 |a| 过 0.5 时 ,和 矩阵 A 是 收敛 的 . 


2 外， 二 J 发 散 ; CT 一 [ 本 。)， 马 入 并 收 全 
(1—A)” -4(。 | 


若 Neumann 级 数 收 伍 , 则 141* 收 售 , 故 141* 一 0, 即兴 一 0, 从 而 pC4) 二 1 
反之 显然 成 立 . 

略 . 

有 一 TI 一 Dr4 一 D 二 (IT 一 D 二 4D 二 ) Di ,因为 D3 了 AD 悦 也 是 实 对 称 和 矩阵 ,因此 B 
的 特征 值 为 实数 . 

必要 性 . 若 o(B) 二 1, 则 和 矩阵 D3 了 AD 悦 的 特征 值 在 区 间 (0,2) 内 , 故 4 之 0. 同 理 
可 证 2D 一 4 二 0. 

充分 性 . 因为 4 之 0, 其 特征 值 为 正 数 ,而 2 (TI 一 B) D 二 一 DA4AD 一 ,因此 TI 一 B 
也 为 正 数 , 即 B 的 特征 值 均 小 于 1. 同 理 再 利用 DY(2D 一 4A) D3 = DCT 十 B) 
D 习 ,可 知 B 的 特征 值 均 大 于 一 1. 


习题 答案 与 提示 。359 。 


6. 10 
06. 17 
6. 19 


人 


22 
24 


们 


6.25 


6.26 


设 Bosv 二 入 , 则 Uy 二 A(D 一 DL)v, 两 边 左 乘 ,并 注意 到 U 二 1L', 得 wiL'v 一 

hyapy CO—viLy. 令 yviDy = d,viLy 二 a 十 则 WiiLiy 二 a 一 ,所 以 a 一 b= 二 

A[d 一 (a 十)]. 两 边 取 模 ,并 注意 到 viAy = 二 下 (D 一 L 一 Uv 二 d 一 24 0, 因此 

a 起 =|A|:[(d—a)? 二 5] = |4|l:[d(d—20)+a 二]> |4|:(a’ 二 +b) 

此 即 |4| 二 1. 

设 A 三 0, 考虑 矩阵 4 一 1 显然 4 一 本 也 是 严格 对 角 占 优 和 矩阵 ,因此 A 一 并 可逆 . 

由 于 4 的 任意 性 ,可 知 4 的 特征 值 均 大 于 零 , 从 而 4 二 0. 

若 有 ZX Ex 十 Kx 使 得 RC(x) 取 极 小 值 . 则 对 于 任意 实数 a 和 任意 向 量 v € Kx, 都 有 
|b—A(x+ar li =|1b—Axl? 

令 f(a) = 1b 一 A(xX 十 av) 上 ,由 于 a 二 0 时 f(a) 取 极 小 值 ,因此 (0) = 0. 计 

算 可 知 此 即 (6 一 Ax ,Av) 二 0. 由 于 的 任意 性 ,从 而 上 式 对 Li 二 AKi 都 成 立 , 此 即 

Galerkin 条 件 的 矩阵 表达 形式 . 


一 Sint 一 cost 一 SInL cost 1 1 
a i 
cost 一 Sint 一 OoSF =Sint sinl 0 


1 
A 
| 


) (2 ( , ) (3)| a 
A —104—3)/ 0 和 一 1830 十 DA 人 
diag(151 二 1 人 十 1 一 17 忆 十 1 人 一 1727。 

(1) (2 一 1)?; (2) OA 一 1D)3 (一 2)2 (4 一 3)*.。 6.18 略 . 


A 一 A, 则 m4) = 二 4(24 一 1), 最 小 多 项 式 无 重 根 . 6.20 略 . 


m 1 1 1 
设 5, = py 商人 ' 则 lim5。 一 ,上 且 有 u(S,) 去 3 而 4) 之 站 (4 一 


A 十 1) 


er 以 及 |ulS,) 一 ule ) | 过 ul(S, —e) 一 0 因此 xzes) = limu(S,) 去 ee. 


略 . 6.23 因为 4h8 一 一 人, 所 以 (ed)Ee 一 的 太一 ee 一 eo 一 工 
Tcosl 十 4sin1,， Asinl, Icosl. 


e! 0 0 sinl 0 0 = 昌 机 
er 一 ez ex —te*|, |sinl—sin2 sin2 一 cos2|,，| 一 2 1 0|， 
0 0 es | 0 0 sin2 @ ff 1 
arctan 了 0 0 
arctan 1 arctan 1 arctan 工 4 
4 2 2 5 
0 0 arctan 2 
2 
(1 — 2t)e” 一 i Sy We ay 
dte” (2t+l)e*)” 4\4 6/"\ 2 ln2 十 1 和 
arctan2 ”一 于 arctanl 十 arctan2 = Sarctanl 市 寺 arctan2 
(2 0 0 arctanl : 
0 arctanl 0 
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.30 
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.34 
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, , ezt ee 和 Se et 
村 
(3)@ J diag(e!2"™ sed 其 中 ey2 1) es 站 | yeys (2) = 2 2 , 
et € te 
et 
sinl cosl 
sinA = diag(sin J,(1),sin J3(2)), 其 中 sin J,(1) = ( 小 
sin 
sin2 cos2 一 去 sin2 
sin J3(2) = sin2 COs2 
sin2 
cosbp sinb 
.27 厂 ( 
一 SIDO cosb 
@& OO 外 工 0 
.28 PP=|10 ee el, 其 中 P= 0 ?2 1 ||. 令 M = diag(l1,1,e ?1), 则 
0 0 e = 二 1 


P, 二 PM 即 为 所 求 . 
sin2 0 0 

同 理 , P (Csin4)P 王 | 0 snl cosl|. 令 N= diag(l,1,(cos1)71), 则 P, = 
0 0 sinl 


PN 即 为 所 求 . 

由 于 4 与 4T 相 似 , 因 此 4 与 4T 的 Jordan 标准 型 相同 , 且 4 与 AT 有 相同 的 最 小 多 
项 式 , 所 以 f(2) 在 4 的 谱 集 c(4) 上 有 定义 ,并 且 4 与 47 的 多 项 式 p(4) 可 以 是 
相同 的 , 故 f(4) = pC4)，, 从 而 FC4T) = p(47) = [pC4) 了 一 [Fa)T 

| , 从 而 时 = (es ) 一 (e&)T 一 J | 


et e2 


2 


设 了 一 4T, 则 ee 二 ', 


6 9 
ka 到 
4 11 


te 


ez! 


1 1 
| sin(A1 )dt 一 4 | LeosCA) J a = A'(cosA CO—71). 


a C We 0 SE 
提示 A 
9a; ay | A | gd Uy 


设 和 二 GW), 则 fCX) = wr XBX) = xiBri xBr, xiBx,, 
ad 一 (Cd rom ，,-d .dd 
ax! ‘X) 一 (x 7 GD 3)， :了 (7) 

= ((B+B') x,(B+B') xz (及 十 BIT) x,) = (B+ BT)X. 


m 


a max >， | |a; Cs) | ds = | (max >) |aj(s)| )ds， 即 
7 i=1 “如 0 1 i=l 


m 
max > 
7 i=] 


| was 


| A(Cs)ds 


<| lawhas 
其 他 类 似 可 证 . 


SS 这 


40 
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(ZX1(t) 一 (1 十 12t7e ,zx2(t) = Me zi) 一 (1 一 6t)e 

(1) w(t = (el re 0, (2 RY 一 十 2 

x(1) 一 (tel ,e’! 2te'™,e’— 2te)T. 

验证 可 知 关 (1) 二 (cosA4(1)) Ci 十 (sin4(7)) Cs 是 二 阶 和 矩阵 微分 方程 的 解 ,其 中 
G@ 一 天 ou = A Ri 

y1 = yyyt = 3ys —2y. Xt) 一 页 一 (2c 一 cz) 人 十 (cs 一 ci)e2 = Ce Cer. 


习 题 七 


G4)={z||z|<1}),G(4)= {z||lz—5|<2},G(4) = {z ||z—9|<< 3}. 
取 D= diag(0.5,1,1), 则 B= 二 DAD 的 三 个 分 离 的 盖 尔 圆 为 

GB)= {z||z|<2}, GB) = {z||z—5|<1.5), G/B) = {z ||z—9|<2) 
因为 吾 的 每 个 盖 尔 圆 内 有 且 仅 有 一 个 特征 值 ,因此 和 矩阵 召 没 有 复 特 征 值 ,注意 到 4 与 
B 的 特征 值 相同 ,所 以 4 的 特征 值 满足 一 2 志和 过 2, 3.5 乏 入 6.5,7 和 及 入 11. 
G(A4)= {z||lz—20|<4),G(4) = {z||z—10|<4},6G;(4) = {z||z| 过 9). 
GH) = {z|lz—20|<10), G4 ) = {z|lz—10|<4}, G/U) = {z ||z|<3}. 
显然 G1 孤立 ,其 中 令 和 4 的 一 个 特征 值 , 记 作 入 , 则 16 坟 二 24; Gz 孤立 ,其 中 
含 4' 的 一 个 特征 值 , 它 也 是 4 的 特征 值 , 记 作 Xs, 显然 一 3 过 A 过 3. 设 4 剩 下 的 
特征 值 为 A2, 则 Xs E Gs UG;, 且 hE€ G1 UG, 因此 A; € (G;: UG) NN (GI!U 
G1) =G,,B 妈 D6<h 14. 

0 | 

0.9 1 
对 4 的 任意 特征 值 M, 存在 盖 尔 圆 Gi , 使 得 AGE Gi, 即 |4 一 axm | 寺 为 之 ams 因为 
a 六 0, 故 0 二 ReC) 二 2aw 


| 


o(4) < 1A|,.= 2 |a; |) < max(2|as 胁 于 二 = 2 max |as . 

A =2, x = hk (2,1)T (kA0);Nhs =—2/3, x = ko (2,—1)T (ks 0). 

设 RGo 二 (hx,x) 且 上 |x|; 二 1, 则 为 志 RGY) 过. 取 x==@; 即 单位 矩阵 的 第 i 列 , 则 
NR(e) = a Nh 
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3. 4. 2 最 佳 逼 近 定 理 及 其 应 用 
3.5 ”Househol der 变 换 与 G vens 变 换 
3. 5. 1 正 交 变换 及 其 矩阵 
3. 5.2 求 QR 分 解 的 Househol der 变换 法 
3. 5. 3 下 蛋 的 母 鸡 
3. 6 西 空间、 本 变换 与 本 和 矩阵 
习题 三 
第 4 章 ”特殊 变换 及 其 矩阵 
4. 1 正规 变换 与 正规 矩阵 
4. 1. 1 正规 变换 
4. 1. 2 正规 矩阵 
4.2 Hermte 变 换 与 Harmte 和 矩 阵 
4. 2. 1 Hermite 变 换 (Hermte 和 矩阵 ) 的 定义 和 性 质 
4. 2. 2 达到 教育 的 目的 是 用 头脑 ， 又 不 是 用 脚 
4. 2. 3 正定 Hermite 和 矩阵 
4. 2. 4 对 称 : 是 可 怕 的 还 是 可 爱 的 ? 
史 变 换 与 投影 矩阵 
谱 分 解 的 应 用 
-1 4. 1 离散 Kar hunen- Loeve 变 换 
4. 4. 2 主 成 分 分 析 
4. 5 矩阵 的 奇异 值 分 解 


4. 5. 1 从 几何 观测 说 起 
4. 5. 2 由 SVD 导 出 的 矩阵 性 质 
4. 5. 3 ”SVD 的 算法 
4. 5.4 ”SV[ 教 授 
4. 6 矩阵 的 标准 型 
4. 6. 1 实 正规 矩阵 在 正 交 相似 下 的 标准 型 
4. 6. 2 各 种 矩阵 标准 型 之 间 的 关系 
习题 四 
第 5 章 ” 范 数 及 其 应 用 
5. 1 向 量 范 数 
5. 1. 1 从 绝对 值 及 模 说 起 
5. 1. 2 常用 的 向 量 范 数 
5. 1. 3 向 量 范 数 的 几 个 性 质 
5. 2 矩阵 范 数 
5. 2. 1 矩阵 范 数 的 概念 
5. 2. 2 算 子 范 数 及 范 数 的 相 容 性 
5. 2. 3 矩阵 范 数 的 几 个 性 质 
5. 3 范 数 的 几 个 应 用 
5. 3. 1 谱 半径 与 矩阵 范 数 
5. 3. 2 线性 方程 组 解 与 矩阵 逆 的 扰动 分 析 
5. 3. 3 矩阵 的 低 秩 逼 近 及 其 应 用 
5. 3. 4 只 要 本 着， 你 就 必须 思考 数学 
习题 五 
第 6 章 “和 矩阵 分 析 及 其 应 用 
6. 1 和 矩 阵 序列 与 矩阵 级 数 
6. 1. 1] 矩阵 序列 
6. 1. 2 和 矩阵 级 数 
6. 2 解 线性 方程 组 的 古典 迭代 法 
6. 2. 1 三 种 基本 迭代 法 
6. 2. 2 敛 散 性 分 析 
6. 3 解 线性 方程 组 的 现代 迭代 法 
6. 3. 1 共 斩 梯 度 法 
6. 3. 2 子 空间 迭代 法 
6. 3. 3 那些 年 ， 那 些 事 
6. 4 画 数 矩 阵 及 入 矩阵 
6. 4. 1 画 数 矩 阵 
6.4.2 入 和 矩阵 及 其 Smit h 标 准 型 
6. 4. 3 Smith 标 准 型 的 应 用 
6. 5 矩阵 函数 及 其 计算 
6. 5. 1] 矩 阵 函 数 的 定义 及 性 质 
6. 5. 2 和 矩阵 函数 的 计算 


6. 5. 3 矩阵 指数 函数 的 数值 计算 : kryl ov 子 空间 法 
6. 6 和 矩阵 的 微分 与 积分 
6. 6. 1 含 参 和 矩阵 函数 的 微分 与 积分 
6. 6. 2 画 数 对 向 量 的 微分 
6. 6. 3 矩阵 标量 函数 对 和 矩阵 的 微分 
6. 6. 4 矩阵 对 矩阵 的 微分 
6. 6. 5 成 于 计算 ， 败 于 算计 
6. 7 矩阵 函数 的 应 用 
6. 7. 1 线性 常 系数 微分 方程 组 
6.7.2 应 用 1 : 线性 定常 系统 的 状态 转移 矩阵 
6. 7. 3 矩阵 微分 方程 
6. 7. 4 应 用 1 : 线性 时 变 系统 的 状态 转移 矩阵 
6. 7. 5 应 用 川 : 线性 时 变 系统 的 能 控 性 和 能 观测 性 
习题 六 
第 7 章 ”特征 值 问题 
7. 1 特征 值 的 估计 
7. 1. 1 从 特征 值 问题 的 稳定 性 说 起 
7. 1. 2 盖 尔 定理 
7. 1. 3 特征 值 的 界 
7. 2 多 项 式 特征 值 问题 
7.2. 1 广义 特征 值 问题 
7. 2. 2 二 次 特征 值 问题 
7.3 Raylei gh 商 和 广义 Rayl ei gh 商 
7. 3. 1 Rayl ei gh 商 
7. 3. 2 广义 Rayl ei gh 商 
7. 3. 3 乐 在 其 中 的 瑞 利 勋 融 
7. 4 特征 值 问题 的 数值 算法 综述 
7. 4. 1 扰动 和 敏感 性 
7. 4. 2 宕 法 与 反 罕 法 
7.4.3 QR 法 
7.4.4 kryl ov 子 空间 法 
7. 4. 5 Jacobi - Davi dson 法 
7. 4. 6 兰 乔 斯 先生 ， 请 您 压 阵 
习题 七 
习题 答案 与 提示 
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